Az adatmátrix, az adatok átalakítása
|
|
- Viktória Fülöp
- 9 évvel ezelőtt
- Látták:
Átírás
1 2 Az adatmátrix, az adatok átalakítása (Az elsõ bátortalan lépések... de még sok minden rejtve marad) A mintavételezés során, mint láttuk, a mintavételi egységeket változók segítségével írjuk le. A kapott adatok célszerûen egy téglalap alakú táblázatba írhatók; mondjuk úgy, hogy a sorok felelnek meg a változóknak, az oszlopok pedig a mintavételi egységeknek. Erre már láttunk is példát az elõzõ fejezetben, amikor a binarizálás módszerét illusztráltuk. A biológus egy ilyen táblázatot leggyakrabban a következõ formátumban készít el: 1. egyed 2. egyed 3. egyed Hossz Szélesség Magasság Ebben az egyszerû példában 3 változó jellemez 3 mintavételi egységet, egy faj három egyedét. E táblázat letisztult formában, cimkézés nélkül adja az adatmátrixot. Könyvünkben az adatmátrix jele X (konvenció szerint: kövér betûvel), azaz: X n,m 12 = (2.1) Mint látjuk, az egész mátrixot szögletes zárójelbe kell tenni, de nem nagy baj, ha a hagyományos, ívelt zárójelet alkalmazzuk. (Ugyanakkor vigyázzunk: ha a mátrixot két függõleges vonal közé írjuk, az már mást jelent, lásd a C függeléket.) A mátrix i-edik sorában és j-edik oszlopában található értéket x jelöli. A sorok száma ezentúl n, az oszlopok száma pedig m lesz a könyv hátralévõ részében. Erre utal az alsó n,m index. Az A függelékben megadunk több, nagyobb méretû valós és mesterséges adatokat tartalmazó mátrixot is, melyeket a módszerek illusztrálásához fogunk majd felhasználni.
2 38 2. fejezet Felhívjuk a figyelmét azoknak az Olvasóinknak, akik más könyvekben is utánanéznek az itt leírtaknak, hogy minden esetben tisztázzák még az elején: a változók a sorokban vagy az oszlopokban vannak-e. Ezzel elkerülhetõk a képletek értelmezésekor adódó esetleges félreértések. A többváltozós elemzést elsõsorban matematikai szempontok szerint tárgyaló könyvek egy része (pl. Chatfield & Collins 1980, Dillon & Goldstein 1984, Mardia et al. 1979, Reyment & Jöreskog 1993) a változókat oszlopokként szerepelteti, mások (pl. Anderson 1958, Kendall 1975) sorokként. Ez utóbbi az általános a biológiai témájú könyvekben is, hiszen a fajok ill. karakterek rendszerint a sorokban szerepelnek, pl. Pielou (1984), Orlóci (1978), Pimentel (1979), Sneath & Sokal (1973), hogy csak néhányat említsünk. 2.1 Az attribútumok dualitása és az adatmátrix geometriai jelentése Elõször is tisztázzuk, hogy a továbbiakban objektumnak nevezzük majd az elemzés alapegységeit (vagyis amit osztályozunk, stb). Egy rendszertani vizsgálatban szereplõ állategyedek általában tehát objektumként, tulajdonságaik pedig változóként szerepelnek. Hasonlóképpen, a növényzetben elhelyezett kvadrátok jelentik a késõbbi analízis objektumait, a bennük talált fajok pedig a változóit. Ez összhangban is van az eddig elmondottakkal: a mintavételezés egységei egyben az elemzés objektumai is, a mintavételi egységek jellemzõi pedig az elemzés változói. Ebben az esetben a mintavételi egységeket pontokként képzelhetjük el a változók mint tengelyek alkotta sokdimenziós térben: az X mátrix m számú pont n-dimenziós (hiper)térbeli koordinátáit tartalmazza (n=3 esetre lásd a 2.1a ábrát). A kutatót persze az is érdekelheti, hogy milyen összefüggések rejlenek a tulajdonságok között, például: milyen fajcsoportok ismerhetõk fel egy növénytársulásban? Ilyenkor a fenti felállás megfordul: a tulajdonságok ill. fajok most az elemzés objektumai lesznek, az egyedek ill. kvadrátok pedig változóként jönnek számításba. A mintavételi egységek voltaképpen egyszerû ismétlésként szerepelnek ahhoz, hogy a változók hasonlósági struktúráját megismerhessük. Ekkor ugyanaz az adatmátrix most úgy értelmezendõ, hogy n számú pont m-dimenziós térbeli koordinátáit tartalmazza (2.1b ábra). 2.1 ábra. A 2.1 adatmátrix kétféle térbeli reprezentációja. a: a tengelyek a mátrix sorai, a pontok a mátrix oszlopai. b: a tengelyek a mátrix oszlopai, a pontok pedig a sorai.
3 Az adatmátrix, az adatok átalakítása 39 A módszerek szempontjából az esetek túlnyomó többségében valójában mindegy, hogy mit tekintünk objektumnak és mit változónak. Az adatstruktúra két különbözõ térbeli reprezentációban vizsgálható, a változók és az objektumok felcserélhetõk mondja ki az attribútum-dualitás néven ismert alapelv (Williams & Dale 1965). Ennek megfelelõen az ökológusok (pl. Gittins 1965) mintatérrõl ( sample space ) beszélnek, amikor is a mintavételi egységek a tengelyek, és fajok terérõl ( species space ), amelynek fajok a tengelyei. Ezzel analóg terek nevezhetõk meg más tudományterületeken is (pl. taxonómiai tér a rendszertani vizsgálatokban). Gyakran találkozhatunk az R- és Q-típusú elemzés elnevezésekkel, amely a fenti két eset megkülönböztetésére szolgál. Ez azonban csak kettõvel növeli a megjegyzendõ kifejezések számát, s enyhén szólva nem járul hozzá a tisztánlátáshoz, hanem felesleges ismételgetésekhez vezet. Jelen kötetben sehol sem használjuk ezeket a terminusokat, de felhívjuk a figyelmet azokra az esetekre, amikor az objektumok és változók felcserélhetõsége kérdéses vagy el sem fogadható. Ilyen pl. a lineáris (szorzat-momentum) korreláció (3.70 formula), amelynek valóban csak a tulajdonságoknál, a statisztikai értelemben vett változóknál van értelme, a benne szereplõ átlag és variancia miatt. Cönológiai kvadrátok vagy két növényegyed lineáris korrelációjáról beszélni viszont nemigen lehet, hiszen az átlagnak és fõleg a varianciának rájuk nézve nincs világos jelentése. (Formailag persze kiszámítható a korreláció bármit is hasonlítunk össze. Ekkor például 1-es korrelációt kapunk két kvadrát között, ha az egyikben éppen kétszer annyi van minden fajból, mint a másikban. Két növényegyed korrelációja is 1 lesz, ha az elsõ minden testmérete éppen a fele a másodikénak. A korreláció tehát valamiféle arányosságbeli hasonlóság kifejezésére alkalmasnak tûnik, de ennek ellenére talán érezzük, hogy ezzel valami nem stimmel.) További fontos különbség az, hogy két változó korrelációja megvizsgálható szignifikancia teszttel is ha a mintavételi egységek random mintából származnak, ezáltal függetlenek két objektumnál viszont nem, hiszen a változók nyilvánvalóan nem jelentenek random mintát (vö. Pielou 1984:8). Biztosan nincs értelme viszont a hasonlósági koefficienseket attól függõen, hogy milyen típusú térben dolgozunk külön-külön elnevezni, amint ezt sok szakkönyv teszi. A számos példa egyike a Dice és a Sorensen indexek. Ezek formailag megegyeznek (3.25 képlet), az egyik fajokra alkalmazva, mint asszociációs koefficiens kapta elnevezését, a másik cönológiai mintavételi egységek összevetésére használatos. Goodall (1973a,b) még sok ilyen párhuzamosságot ismertet. 2.2 Bepillantási lehetõségek a többváltozós adatstruktúrákba A papír síkjában csak két dimenziót tudunk feltüntetni, mégpedig a jól ismert koordinátarendszert alkalmazva. A 2.1 ábra viszont a pontok elhelyezkedését egy 3-dimenziós térben próbálja meg feltüntetni, több-kevesebb sikerrel. A pontok közötti távolságok, az adatok struktúrája itt nem érzékelhetõ tökéletesen, sõt, ha több pontunk lenne a diagram teljesen áttekinthetetlenné válna. Négy vagy több dimenziót pedig már semmiképpen sem tudunk ábrázolni. A könyv nagy része éppen errõl szól: miként lehet egy sokdimenzionalitású térbõl az általunk érzékelhetõ kisdimenzionalitású térbe áttérni, s így láthatóvá tenni a láthatatlant? A bonyolult módszerek ismertetése elõtt érdemes azonban néhány egyszerûbb ábrázolási lehetõséget megismerni. Elõrebocsátjuk, e módszerek túl sok változóra kevéssé alkalmasak és nem oldják meg a dimenzionalitás problémáját sem.
4 40 2. fejezet Képes ábrázolások (piktogramok) E módszerek alapelve, hogy az objektumokat kis képekkel helyettesítjük, melyek tulajdonságai az eredeti változóktól függenek. Ez különösen akkor lehet szemléletes, ha az eredeti objektumok absztrakt jellegûek voltak, s kevéssé érdekes mondjuk növény- vagy állategyedek esetében (hiszen ekkor valójában csupán az egyik a valós képet helyettesítenénk be egy másikkal). Önmagukban talán nem mindig alkalmasak, de jól használhatók pl. ordinációs diagramokon az egyedek azonosítására (amennyiben nincs túl sok pontunk). Megjegyzendõ, hogy a változókat nem feltétlenül eredeti formájukban vesszük figyelembe, hanem terjedelmük szerint standardizálhatjuk is (2.3 formula), hogy összemérhetõk legyenek. A legegyszerûbb képes ábrázolások a csillagdiagramok különféle válfajai és a Chernoffarcok. A csillagdiagramoknál sugárirányban elhelyezkedõ vonalak felelnek meg a változóknak, ezen mérjük fel a változó standardizált értékét (ami akkor éri el az ág végét, ha éppen a mintában lévõ maximumról van szó). A szemléletesség fokozására a sugarak kelölt pontjait össze is köthetjük (2.2a ábra). Érdekesebbek talán éppen humán vonatkozásuk miatt is a Chernoff-arcok (Chernoff 1973), melyek az ember jó arcmegkülönböztetõ képességét próbálják kiaknázni. A karikatúraszerû rajzok tulajdonságai az eredeti változóknak felelnek meg, pl. a száj hossza az elsõ változóval arányos, íveltsége a másodikkal, és így tovább (2.2b ábra). Az arcok megrajzolását szigorú szabályok irányítják, de az arcvonások közötti összjáték esetleg kedvezõtlenül befolyásolhatja az eredményt (pl. nagyon kicsi szájnál annak alakja már nem jól látható, stb). 2.2 ábra. Képes ábrázolások a csillagdiagramokkal (a), Chernoff arcokkal (b) és Kleiner - Hartigan féle fákkal (c) az A1 táblázat oszlopaira. A c ábra fái a standardizálatlan borításértékek alapján készültek, a 12 változó el zetes osztályozása a teljes lánc módszerrel készült euklideszi távolságmátrixból (l. a 3. fejezetet).
5 Az adatmátrix, az adatok átalakítása 41 A fenti ábrázolási formák közös hiányossága, hogy a változók és a képeken látható tulajdonságok közötti megfeleltetés teljesen önkényes, ezért egy más kiosztás egészen eltérõ összképet nyújthat. Ezt oldják meg a Kleiner - Hartigan (1981) féle fák. A végágak hossza arányos egy-egy tulajdonsággal, egy köztes ág hossza pedig az összes hozzátartozó végágtól függ, csakúgy mint a törzsé (2.2c ábra). A végágak és a változók közötti megfeleltetés azonban már a változók hierarchikus osztályozásából származó dendrogramból (5. fejezet) adódik (egyébként ugyanúgy önkényes lenne, mint a többi kép esetében). E módszerrel tehát valójában nem kerültük meg a többváltozós elemzést Kétváltozós szórásdiagramok mátrixa Elemi ábrázolási lehetõség az is, amikor a sokdimenziós adatstruktúrát az összes lehetséges, két változóval definiált síkra levetítjük. Ehhez, ha n változónk van, éppen n(n 1)/2 koordinátarendszerre van szükség. Egy 4-dimenziós adatstruktúra tehát 6 különbözõ nézettel vizsgálható meg. Az ilyen kétdimenziós szórásdiagramok kiválóan alkalmasak arra, hogy vizuálisan meggyõzõdjünk két-két változó összefüggésérõl. Ha megengedjük a tengelyek felcserélését, akkor kétszer ennyi diagramot kapunk, amelyeket mátrix formában is elrendezhetünk (2.3 ábra). Azért nem kell n 2 diagram, mert azokat a koordináta-rendszereket, amelyekben mindkét tengely ugyanaz a változó, felesleges lenne feltüntetni. Ezek helyett a mátrix átlójában rendszerint a változók gyakorisági hisztogramját (Hartigan 1975) vagy gyakorisági poligonját 2.3 ábra. Kétváltozós szórásdiagramok mátrixa az Anderson-féle Iris adatokra (A2 táblázat). Rövidítések: K=külsõ, B=belsõ, L=lepel, H=hossz, SZ=szélesség. Az egyedek érzékelhetõen két csoportra bonthatók, és jól láthatók az eloszlásbeli sajátságok is. KLSZ áll legközelebb a normális eloszláshoz, viszont éppen ez az a változó, melyre nézve a legelmosódottabbak a különbségek a fajok között. A többi változó hisztogramjának többé-kevésbé bimodális jellege a taxonok elválására utal.
6 42 2. fejezet 2.4 ábra. Az Anderson-féle Iris adatok (A2 táblázat) 150 egyedének rotációs diagramja. A forgatást abban a pillanatban állítottuk le, amikor a csoportok közötti különbségek a legjobban érzékelhetõk. X=külsõ lepel szélessége, Y=belsõ lepel hossza, Z=belsõ lepel szélessége. A vízszintes vonal a forgástengely. (Tukey & Tukey 1981a) szokták elhelyezni, ahogy azt sok programcsomag is teszi. A gyakorisági eloszlást érdemes legalább ránézésre megvizsgálni, különösen akkor, ha a normális eloszlás alapfeltétele az elemzésnek. A terjedelemmel rendszerint itt is standardizálunk (mint ahogy a 2.2a,b ábra diagramjain is) Rotációs diagramok A rotációs diagram nagyon szemléletes, a számítógép aktív közremûködését igénylõ módszer három-dimenziós ponteloszlás szemléltetésére a képernyõ síkjában (Tukey et al. 1976). A koordinátarendszer a pontokkal együtt egy vízszintes tengely körül forog, s jó felbontású képernyõn a három dimenzió illúzióját kelti. Néhány forgás után már érzékelhetjük a pontfelhõ alakját. A tengelyeknek a forgástengellyel alkotott szöge is változtatható, s ilymódon olyan síkokat kereshetünk a háromdimenziós térben, melyek legjobban láttatják az adatfelhõ bizonyos tulajdonságait, pl. pontok csoportosulásait, lineáris trendeket stb. (2.4 ábra). 2.3 Az adatok átalakítása A változókat mint az elõzõ fejezetben láttuk sokszor más és más mértékegységben fejezzük ki (összemérhetõség hiánya), de a nagyságrendbeli eltérések is jelentõsek lehetnek (belsõ súlyozás). Ezért a többváltozós adatokat gyakran nem az eredeti, a mintavételezésbõl származó formájukban elemezzük. Ha nem alakítjuk át az adatokat, akkor a nagy különbségek miatt az egyes változók nagyon különbözõ mértékben járulhatnak hozzá a végeredményhez, ami hacsak valami oknál fogva éppen ezt akarjuk mindenképpen kiküszöbölendõ. Sõt, ökológiai adatok feldolgozásában még az objektumok közötti nagyságrendi különbségek eltüntetése is kívánatos lehet! Adatok átalakításának másik fontos indoka a változók eloszlásának módosítása (elsõsorban a normalitás elérése), hogy az eloszlás milyenségére érzékenyebb módszerek is végrehajthatók legyenek. Megjegyzendõ: most változókról ill. objektumokról a hagyományos statisztikai értelemben beszélünk (azaz objektum = mintavételi egység). Ez azért fontos, mert mint rövidesen látjuk bizonyos adatátalakításoknak voltaképpen csak változók esetében van értelme: az
7 Az adatmátrix, az adatok átalakítása 43 attribútum-dualitás érvényessége korlátozott. Az adatátalakítási eljárásokat tehát külön-külön soroljuk fel változókra és objektumokra. Az adatátalakítás két alaptípusát különböztetjük meg: a standardizálást és a transzformációt. (Persze, most rögtön megjegyezheti az Olvasó: transzformáció = átalakítás. Annyi szabadságunk azonban van, hogy az idegen eredetû kifejezéssel egy kicsit speciálisabb dologra utaljunk, mint annak magyar megfelelõjével.) Standardizálás során az átalakítás az adatokból számított valamilyen statisztika figyelembevételével történik, az eljárás tehát adat-függõ. Ilyen statisztika például a variancia, a terjedelem, az átlag, vagy egyszerûen a maximális érték. A standardizálás elsõsorban a súlyozásbeli eltérések feloldására alkalmas. Transzformáció során viszont a függvény és annak paraméterei nem az adatokból számított statisztikákra alapoznak. Ezek például a változók eloszlásának a normálishoz való közelítésére jók. Az eredeti x érték átalakításával kapott új értéket x jelöli a továbbiakban. A változók súlyozását befolyásoló módszereket a 2.5a ábra koordináta-rendszerébe helyezett egyszerû fenyõfával szemléltetjük. A fa alakját két változó írja le: objektumok, azaz a fa kerületén jellegzetes helyeken kiválasztott mérõpontok (= landmark, vö. Bookstein et al. 1985) vízszintes ill. függõleges koordinátája. (Állatok és növények alakjának ilyen típusú leírása általános gyakorlat a numerikus taxonómián belül, a morfometria szakterületén.) A fenyõfa alakjának változása illusztrálja a súlyozásbeli különbségeket. A változók eloszlásának átalakítására alkalmas eljárásokat viszont az eredeti és a módosított gyakorisági eloszlások hisztogramjai szemléltetik majd (2.7 ábra). A fenyõfát leíró nyers adatok, a mérõpontok koordinátái az alábbi táblázatban foglalhatók össze: A következõ fejezetben felsorolt hasonlósági együtthatók jelentõs része eleve tartalmaz bizonyos adatátalakítást (pl. korreláció, húrtávolság). Ha tehát az elemzés során majd ilyen függvényt alkalmazunk, akkor adataink elõzetes standardizálására természetesen nincs szükség Változók standardizálása Centrálás. A legegyszerûbb standardizálási módszer: az eredeti értékekbõl kivonjuk az adott változó átlagértékét: x =x x i (2.2) Valójában a fenyõfa alakjával semmi sem történik, csupán a tengelyek csúsznak el úgy, hogy az origó a fenyõfa súlypontjába kerül (2.5b ábra). A centrálás önmagában ritkán használatos, viszont jelen van más standardizálási eljárásokban ill. függvényekben. A centrálás része a kovariancia- vagy korrelációszámításnak (a fõkomponens- és a kanonikus korrelációelemzésben, lásd a 7. fejezetet). Lineáris standardizálás. Ennek során az i változó értékeit a változóra vonatkozó összes megfigyelés alapján nyert valamely konstans értékkel szorozzuk. Ez, a fenyõfa példáján, azt jelenti, hogy a szimmetriaviszonyok érintetlenül maradnak, az alak nem torzul el, csak
8 44 2. fejezet valamelyik irányban megnyúlik v. összezsugorodik. Ez a változás fordított arányban van a változó éppen alkalmazott statisztikai jellemzõjével (terjedelem, szórás, stb.). Az elsõ két eljárást nem befolyásolja, ha a változó összes értékéhez egy konstanst adunk (azaz standardizálás elõtt a fenyõfát eltoljuk mondjuk 3 egységgel jobbra). Ez azt jelenti, hogy intervallum és arányskálán mért változókra egyaránt alkalmazhatók (hiszen nem függenek a 2.5 ábra. Különbözõ adatátalakítási módszerek hatásának szemléltetése. A fenyõfa megváltozása elsõsorban a súlyozásbeli változásokat szemlélteti (Podani 1994). A mér pontok csak az a ábrán látszanak.
9 Az adatmátrix, az adatok átalakítása 45 0 pont helyétõl). A többi módszernél azonban a konstans hozzáadása már megváltoztatja a standardizálás mértékét, így intervallum-skála esetén már nem alkalmazhatók. Standardizálás a terjedelemmel. Ennek során a változó értékei a [0,1] intervallumba kerülnek: x =[x min j { x }]/[max j { x } min j { x } ] (2.3) azaz a minimumot és maximumot, valamint ezek különbségét kell meghatároznunk minden egyes változóra. A terjedelemmel való standardizálás elsõsorban a belsõ súlyozás kiegyenlítésére alkalmas, de természetesen az össze nem mérhetõ változók is azonos skálára alakíthatók vele. ahol A fenyõfa alakja a standardizálás hatására némiképp megváltozik, mert a két változó terjedelme eltérõ volt (6 ill. 8). Az x változó irányában ható növekedés a fa kiterebélyesedését okozza (2.5c ábra). Ez a standardizálási mûvelet a kevert típusú adatokra kidolgozott és függvényekben már megvan. Standardizálás a szórással. Ennek hatására a változók szórása 1, átlaga pedig 0 lesz: x ={x x i }/ s i (2.4) s i = m j= 1 ( x x m 1 1/ 2 2 i ) az i változó empirikus (mintából számított) szórása. A számlálóban az eltérésnégyzet-összeg, a nevezõben a szabadsági fok szerepel. Ezt az eljárást elsõsorban akkor ajánljuk, amikor az eredeti változókat egészen eltérõ mértékegységekben fejezzük ki (pl. ph, koncentráció, hõmérséklet stb., ugyanabban mintában). Standardizálás hatására az új mértékegység az egységnyi szórás lesz, s ezután minden változó összemérhetõ lesz egymással. A korreláció (3.70 egyenlet) ezt a standardizálást eleve tartalmazza. (2.5) Miután a fenyõfát leíró x és y változók között y javára a szórást tekintve még nagyobb a különbség, mint a terjedelemben, a fa még lapítottabb lesz (2.5d ábra). Standardizálás az összeggel. Minden egyes értéket elosztunk a változóra vonatkozó összeggel: x = x / m j= 1 x (2.6) Ilymódon a nagy értékekkel jellemzett változókat lefelé, a kis értékekkel rendelkezõket felfelé súlyozzuk. Csak akkor logikus a használata, ha az összegnek értelme van, mint a cönológiai kvadrátok esetén, amikor az összeg pl. az i faj összes egyedszámát jelenti a mintában. Az egyedszámban mutatkozó nagy abszolút különbségek ezáltal lecsökkennek. Bár a fenyõfa esetében ilyen standardizálásnak nincs igazán értelme, a szemléltetés kedvéért mégis bemutatjuk (2.5e ábra). Mint látható, az eredetileg nagyobb értékekkel jellemzett y változó új értékei kisebbek lettek, mint az x-é, s a fa alakja nagyon hasonló a 2.5c fához.
10 46 2. fejezet Standardizálás a maximummal. Minden értéket elosztunk a megfelelõ változó mintabeli maximumával: x =x / max j { x } (2.7) Ha a mintában szereplõ értékek minimuma 0, akkor ez a módszer és a terjedelemmel való standardizálás azonos eredményt ad, mint az a 2.5c és 2.5f ábrák összehasonlításából is látszik. Standardizálás egységnyi vektorhosszra (normálás 1 ). A változóknak megfelelõ tengelyekkel jellemzett térben az origóból vektorokat irányíthatunk az objektumokat képviselõ pontok felé. E vektorok hosszúságához a változók különbözõ mértékben járulnak hozzá. Ezt a hozzájárulást teljes mértékben kiegyenlíti a következõ standardizálás: 1/ 2 m 2 / x j= 1 x = x Ennek hatására az egyes változók értékeinek négyzetösszege 1 lesz. (Vagyis, az objektumok mint tengelyek alkotta térben a változókhoz mint pontokhoz mutató vektorok hossza egységnyi). A 2.5g ábra tanúsága szerint e módszer a változók hatását kiegyenlítõ többi eljáráshoz hasonló eredményt ad. (2.8) További, ritkán alkalmazott standardizálási lehetõségek: 1. minden érték osztása a változó terjedelmével (2.3 képlet, de a számlálóban nem szerepel a minimum kivonása), 2. osztás a változó eltérésnégyzet-összegének négyzetgyökével, 3. osztás a változó összegének a négyzetgyökével (azaz a 2.6 egyenlet, de a nevezõ négyzetgyök alatt), és 4. osztás a szórással (azaz a 2.4 egyenlet, az átlag kivonása nélkül) Transzformáció Mint már említettük, transzformáción olyan átalakítást értünk, amely nem az adatokból számított statisztikán alapul. Teljesen önkényesen magunk adjuk meg a transzformáló függvény kitevõjét vagy valamilyen paraméterét. Néhány módszert az elõzõ részben alkalmazott fenyõfa példával illusztrálunk, és így lehetõvé válik a standardizálással való összehasonlítás is. Lineáris transzformáció. Ez a többváltozós elemzés legtöbb módszerére csak elvi lehetõség. Az eredményeket ugyanis az összes értékre egyöntetûen alkalmazott lineáris transzformációk (pl. szorzás egy konstanssal) általában nem változtatják meg. Ha viszont a szorzást egyes változókra korlátozzuk, akkor valójában külsõ súlyozást hajtunk végre. Nemlineáris transzformáció. E módszerek a fentiekkel ellentétben eltorzítják az adatstruktúrát, amint az a fenyõfa szimmetriaviszonyainak a megváltozásában is látható lesz. A torzítás persze sok szempontból hasznos jelenség lehet, amint azt az egyes függvények ismertetésénél is látni fogjuk. Logaritmikus transzformáció. Az összes értéket annak logaritmusával helyettesítjük: x = log c x (2.9) 1 A normálás nem tévesztendõ össze a normalizálással, ami a változó eloszlásánaknormálishoz való közelítését jelentõ transzformáció.
11 Az adatmátrix, az adatok átalakítása ábra. Adatok transzformációja. a: logaritmikus transzformáció, b: hatványozás, c: arc sin transzfor-máció, d: Clymo transzformáció. x-tengely: nyers adat, y-tengely: transzformált adat. ahol c a logaritmus alapja (rendszerint e a természetes logaritmus esetén, vagy 10). Ez a transzformáció nagyságrendbeli különbségek eltüntetésére alkalmas, és jól alkalmazható egyedszám-adatok átalakítására, ha az abszolút mennyiségi különbségek helyett a nagyságrendbeli különbségeket tartjuk fontosnak. 10-es alapú logaritmus esetében például az 1 és 10 közötti különbség ugyanakkora lesz, mint a 10 és 100 közötti (2.6a ábra). Más jellegû, bármilyen arányskálán mért változónál is értelmes lehet ez az átalakítás, ha a változó eloszlása erõsen jobbra ferdül (azaz jobbra elnyújtott, 2.7a ábra). A transzformáció eredményeképpen az eloszlás közelítõen szimmetrikussá tehetõ, s ekkor már közelebb állunk a sok módszer által megkövetelt normalitási feltételhez (2.7b ábra). A logaritmikus transzformáció szerves része az alak elemzését célzó többváltozós allometriának (lásd késõbb). Egyes vélemények ugyanakkor azt sugallják, hogy a logaritmikus transzformáció nem minden esetben elõnyös (Reyment 1971, 1991), s megnehezítheti az eredmények interpretálását. A logaritmusfüggvény csak pozitív értékekre számítható ki, s mivel a 0 értékek igen gyakoriak a biológiai adattáblázatokban, a fenti formula a következõvel helyettesíthetõ: x = log c (x +1) (2.10) A 2.5h ábra jól illusztrálja a logaritmikus transzformáció hatását: kis értékkel kódolt részek (a baloldali ágak és a törzs) nagyobb súlyt kapnak, a nagyobb értékûek fontossága pedig csökken. Hatványozás. Az eredeti értékeket az alábbi hatványfüggvény segítségével alakítjuk át: x = c x (2.11) Az eredmény erõsen függ c értékének a megválasztásától (2.6b ábra). Ha c>1, akkor a nagy értékeket még inkább fontosnak tekintjük, erre azonban igen ritkán lehet szükség (2.5i ábra). Sokkal fontosabbaka c<1 feltétel melletti transzformációk, elsõsorban a c=0.5 (azaz a négyzet-
12 48 2. fejezet gyök transzformáció). Az átalakítás eredményeképpen a nagy értékek túlsúlya csökken. Poisson eloszlású egyedszámadatok esetén a négyzetgyök transzformációval jól közelíthetõ a normális eloszlás (2.7c-d ábra), bár a transzformáció hagyományos alkalmazási területe a varianciák stabilizálása. A hatványozás c= 1 esetén a reciprok értéknek felel meg. A fenti transzformációk egy függvénycsaládba egyesíthetõk Box & Cox (1964) javaslata szerint: 2.7 ábra. Transzformációk hatása változók eloszlására. a-b: logaritmikus transzformáció erõsen jobbra ferde eloszlásból, c-d: négyzetgyök transzformáció, e-f: arc sin - négyzetgyök transzformáció relatív gyakorisági adatokból. A folytonos vonal az adatokra illesztett normális eloszlásnak felel meg.
13 Az adatmátrix, az adatok átalakítása 49 λ x = ( x 1), ha λ 0; x = ln x, ha λ = 0. (2.12a) (2.12b) Amikor λ=1 egy egyszerû elcsúsztatásról van szó. Ez semmi lényeges következménnyel nem jár. Ha λ=0,5, a négyzetgyök transzformációt kapjuk, λ=0 pedig megfelel a logaritmikus transzformációnak. A függvénycsalád arra használható, hogy λ szisztematikus változtatásával megállapíthassuk a normális eloszlásra adott legjobb illeszkedést, az alábbi ún. log likelihood becslõfüggvény alapján (Sokal & Rohlf 1981a): ν 2 ν (2.13) Li = ln st + ( λ 1) ln x 2 m j ahol s T a transzformált adatok varianciája, ν a szabadsági fokok száma, m a mintanagyság. Azt a λ-t, melyre nézve a fenti összefüggés maximumot ad, lesz célszerû alkalmazni a transzformációban. Az eljárás, relatíve nagy számítási igénye és a többváltozós módszerek viszonylagos robusztussága miatt, inkább az egyváltozós statisztikában használatos. Mivel a 2.11 függvény x = 0ésc=0,5 esetén nem értelmezhetõ, helyette a következõ formulát alkalmazhatjuk: x = (2.14) x Arcus sinus transzformáció. Ez a függvény 0 és 1 közé esõ értékek átalakítására alkalma (2.15) s: x = arcsin x de nem ebben a formában használjuk, hanem a négyzetgyökkel kombinálva (következõ oldal). A teljesség kedvéért azonban bemutatjuk a transzformáció hatását (2.5j és 2.6c ábra) Clymo-féle transzformáció. Ez a függvény feltételezi, hogy az adatok arányokat fejeznek ki, és 0-tól 1-ig terjednek. (Ha adataink nem ilyenek, akkor az összeggel standardizálunk elõször a 2.6 egyenlet alapján). A függvény alakja a következõ: x = (1 e cx ) /(1 e c (2.16) (van der Maarel 1979). A függvény segítségével egy transzformációsorozat állítható elõ, pl. cönológiai adatsorok vizsgálatára. A c paraméter változtatásának hatását a 2.6d ábrán láthatjuk. Nagy c értékekre a prezencia/abszencia típust közelítjük a transzformációval. 0-hoz közeli c értékeknek gyakorlatilag nincs befolyásuk az adatokra. (A c=0 esetre a függvény nincs értelmezve.) Növekvõ negatív c értékekre pedig a nagy számok túlhangsúlyozása és a kicsik negligálása érhetõ el. Mindez a megfelelõen módosított fenyõfapéldán is jól látható (2.5k-l ábra). A többváltozós elemzésben ritkán alkalmazott további transzformációk az exponenciális függvény (x = ) és az arcus cosinus függvény (x = arc cos x ). e x ) Binarizálás. Intervallum- vagy arányskálán mért változókat gyakran át kell alakítanunk bináris (prezencia/abszencia) adatokká (pl. ha mindenképpen ki akarunk próbálni egy ilyen adattípust igénylõ módszert). Ekkor x = 1, ha x p; > x = 0, ha x p (2.17a) (2.17b)
14 50 2. fejezet ahol p a binarizálás küszöbértéke, amelyet többnyire 0-nak választunk (minden pozitív érték jelenlét -nek számít). Összetett transzformációk. A fentiekben ún. elemi transzformációs függvényeket mutattunk be. Vannak esetek, amikor két vagy több függvényt kombinálunk a transzformáció során, s így érjük el a kívánt eredményt. Alaktranszformáció. Ha adataink valamilyen alak körvonalait írják le 2 (többváltozós allometria), akkor fõkomponens vagy kanonikus korreláció elemzés elõtt Darroch & Mosimann (1985) javaslatára a következõ kombinált transzformációt célszerû elvégezni. Elõször az adatokat logaritmikus transzformációnak vetjük alá, majd standardizáljuk az új átlagértékek kivonásával: azaz elõször a 2.9, majd a transzformált adatokra a 2.2 függvényt alkalmazzuk. (Megjegyzendõ, hogy a centrálás benne van a fent említett elemzésekben, így voltaképpen az elemzést megelõzõen elegendõ a logaritmikus transzformációt végrehajtani.) Arcus sinus - négyzetgyök transzformáció arányokra. Csak relatív gyakoriságokra alkalmazható, amikor az adatok pl. arányokat fejeznek ki a [0,1] intervallumban. Elõször az összes érték négyzetgyökét vesszük, majd végrehajtjuk a 2.15 transzformációt. A módszer a többváltozós elemzésben legfeljebb a normális eloszlás közelítésére jöhet számításba. A transzformáció hatása kevéssé olyan erõteljes, mint a logaritmikus tanszformációé (2.7e-f ábra) Objektumok standardizálása Változók átalakítása általánosan elterjedt, rutinszerû mûvelet, az objektumok szerinti standardizálásra viszont elsõsorban az ökológiában kerülhet sor (bár ennek igénye a taxonómiában is felmerülhet, vö. Sneath & Sokal 1973:156). Ennek célja például az lehet, hogy a mintavételi egységek közötti borításbeli különbségeket csökkentsük. Azaz, egy kvadrát amelyben sok faj, de viszonylag kis mennyiségben van jelen, olyan fontos legyen, mint amelyben ugyanannyi faj sok egyeddel van képviselve. A standardizálás hatását három objektummal, cönológiai kvadráttal illusztráljuk, amelyekben négy faj található. Ezek borítása a szemléletesség kedvéért a magasságukkal lesz arányos a 2.8 ábrán. A nyers adatmátrix a következõ: 1,0 0,5 5,0 5,0 2,5 3,0 3,0 1,5 1,5 1,0 0,5 0,75 Az objektumok standardizálásának geometriai értelmezését próbálja elõsegíteni a 2.9 ábra is. A tengelyek két változónak felelnek meg, a pontok pedig négy objektumot képviselnek. Az adatokat nem adjuk meg, a koordináták leolvashatók az ábráról. Centrálás. Az objektum átlagértékét vonjuk ki az összes adatból: x = x x j (2.18) Mivel itt negatív értékeket is kapunk, az eredményt nem mutatjuk be a 2.8 ábrán. Jól illusztrálható viszont a centrálás hatása két dimenziónál (2.9a ábra): az összes pont egy átlószerû 2 A 7.6 alfejezetben bemutatott módszerekilyen standardizálást nem tesznekszükségessé.
15 Az adatmátrix, az adatok átalakítása 51 egyenesre kerül. Három dimenziónál egy síkra, még több dimenzió esetén hipersíkra vetül mindenpont. Acentrálásmûveletévelvoltaképpenegy dimenzió kiesik, az átlóra merõleges irányú nagyságrendi hatás eltûnik. Standardizálás a terjedelemmel. Az eredeti értékekbõl kivonjuk a minimumot, majd elosztjuk az objektum terjedelmével. x =[x min i { x }]/ [max i { x } min i { x } ] (2.19) A standardizálás eredményeképpen minden objektumban 0 és 1 közé kerülnek az értékek (2.8b ábra). A minimális egyedszámú (vagy borítású) fajok (1 és 4) azonban a standardizálás hatására el is tûnnek, s ez nem feltétlenül kívánatos. Két dimenzió esetén az új értékek vagy 0-val vagy 1-gyel lesznek egyenlõek, így minden pont két új pozícióba csúszik össze (2.9b ábra). Több dimenziónál ez természetesen már nem így lesz: a pontok az egységnyi oldalú hiperkocka felületére kerülnek. 2.8 ábra. Standardizálás objektumok szerint. A növények magassága arányos a fajok borításával (Podani 1994).
16 52 2. fejezet 2.9 ábra. Objektumok standardizálásának hatása két változó esetén. Üres körök: eredeti objektumok, telt körök: standardizált objektumok.
17 Az adatmátrix, az adatok átalakítása 53 Standardizálás az összeggel. Az objektumhoz tartozó összeggel osztunk minden értéket: x = x / n i= 1 x (2.20) Ilymódon az új értékek összege 1 lesz, és az adatok az objektumbeli arányokat fogják tükrözni (2.8c ábra). Két dimenzióban a pontok az egységsugarú kör húrjára vetülnek (2.9c ábra), három dimenzióban egy egyenlõ oldalú háromszögre, sok dimenzióban egy hipersíkra. Standardizálás a maximummal. Az objektumhoz tartozó adatok maximumával osztunk minden egyes értéket: x =x /max i { x } (2.21) A módszer csak akkor tér el a terjedelemmel történõ standardizálástól, ha minden változónak 0-nál nagyobb az értéke az objektumban, ahogy a példában is (2.8d ábra). Valós adatok esetében azonban a minimum gyakran 0 (egyedszám, borításadatok sok fajra), így a két módszer egyezõ eredményt ad. Két változó esetén az objektumokat az egységnyi oldalú négyzet kerületére (2.9d ábra), több dimenzióban pedig az egységnyi oldalhosszúságú hiperkocka felületére vetítjük. Standardizálás egységnyi vektorhosszra (normálás). Ekkor minden értéket elosztunk az objektumra vonatkozó négyzetösszeg gyökével: n 1/ 2 2 / x i= 1 x = x (2.22) A standardizálás hatását a 2.8e ábra is illusztrálja, de ez kevésbé szemléletes. A változókkal mint tengelyekkel jellemzett térben ugyanis a standardizálás azzal a következménnyel jár, hogy minden pont amelyek tehát most objektumokat jelentenek egységnyi távolságra lesz az origótól. Azaz, a pontok az egységsugarú hipergömb felületére kerülnek (két dimenzióban az egységsugarú körre, 2.9e ábra). A húrtávolság (3.54 egyenlet) ezt a standardizálást tartalmazza. Kettõs centrálás. Objektumok és változók egyidejû standardizálásáról van szó, a következõk szerint: x =x x i x j x (2.23) ahol x a fõátlag, az adatmátrix összes értékére. Nyilvánvalóan ennek csak akkor van értelme, ha az összes változót ugyanazon a skálán mértük. Ha például a változók fajok borításai, akkor x a fajok átlagos borításának felel meg. A centrálás eredményeképpen a változókat és az objektumokat egyformán ítéljük meg. Egy ritka faj, ha fajszegény kvadrátban fordult elõ nagymértékben súlyozódik, a fajgazdag kvadrátokban talált gyakoribb fajok pedig kis súlyt kapnak. Az egyedi, unikális ill. átlagos viselkedés ilyen megkülönböztetése értelmes lehet az ökológus szempontjából (vö. Noy-Meir et al. 1975). Kettõs standardizálás az összeggel. Az adatmátrix minden értékét elosztjuk a megfelelõ sorés oszlopösszeggel is. Ez az eljárás a χ 2 -távolságba (3.67 formula) van beépítve, és fontos szerepe van a korreszpondencia elemzésben (7.3 alfejezet).
18 54 2. fejezet 2.4 Irodalmi áttekintés Többváltozós adatok egyszerûsített grafikus szemléltetéséhez a legtöbb ötletet a Barnett (1981)szerkesztette kötet adja, elsõsorban is a fejezet (Tukey & Tukey 1981a,b,c). Néhány perspektivikus ábrázolást a fizikából kölcsönzött példák illusztrálnak, de pl. az Anderson (1935, 1936)-féle Iris adatokra is találunk olyan módszert, amelyre jelen könyvben már nem jutott hely. Barnett (1981)azonban csupán áttekintõ munka, ne számítsunk a technikai részletek alapos ismertetésére, ebben inkább a bõséges bibliográfia segíthet. Az Olvasó figyelmébe ajánlható még Everitt & Nicholls (1975), Everitt (1978) és Wegmen et al. (1993). Két vagy többváltozós ökológiai adatok bemutatási lehetõségeire sok példát említ Digby & Kempton (1987), bár ezek jelentõs része éppen a fent említett Barnett-féle kötetbõl származik. Érdemes lehet még a Green (1979)által összefoglaltakat is áttekinteni, bár a közölt ábrák nem annyira az elemzést megelõzõ, hanem inkább az elemzést követõ illusztrációs lehetõségek sokféleségét szemléltetik. Reyment (1991)is bemutat egy, még nem említett ábrázolásmódot, a háromdimenziós perspektivikus vetületre alkalmazott drótdiagramot ( wireline diagram), bár a példák kevéssé meggyõzõek. Az adatok átalakításáról a legtöbb szakkönyv legalábbis megemlékezik. Pl. Gordon (1981) a standardizálást a változók összemérhetõségével és súlyozásával kapcsolatosan említi meg, de mellõzi a módszerek részletes tárgyalását, s transzformációról egyáltalán nem szól. Hasonló a helyzet Dunn & Everitt (1982)könyvével is, holott a numerikus taxonómia egyik alapvetõ kérdése a standardizálás, mint a karakterek egyenlõ súlyozásának fõ lehetõsége. Taxonómusoknak ezért még mindig Sneath & Sokal (1973: )összefoglalóját ajánlhatjuk elsõsorban. Mayr & Ashlock (1991)erõsen kritizálják és elvetik a szórással történõ standardizálást mondván, hogy a kevéssé ingadozó karakterek túl nagy súlyt kapnak az elemzésben, míg a rendkívül élesen elváló karakterek fontossága csökken. Hasonlóan vélekedik Stuessy (1990)is: szerinte nem szabad minden változót egyformán figyelembe venni, ha csak egy részük variabilitása magyarázható biológiai okokkal, másoké pedig elsõsorban mérési hibákból származik. Ez valóban egy megfontolásra érdemes szempont mindenki számára; bár annak eldöntése, hogy a változók varianciája honnan származik, nem könnyû feladat. Megjegyezzük, hogy ebben a szemléletben a kladisztika (6. fejezet)erõteljesen differenciáló karakter-súlyozási törekvése ismerhetõ fel. A standardizálás és a transzformáció általunk alkalmazott megkülönböztetése összhangban van sok munkával, pl. Sokal & Rohlf (1981a)vagy Rohlf (1993). A matematikai statisztikában jártasabbaknak viszont feltûnhet, hogy a standardizálást itt jóval általánosabb értelemben használtuk, ugyanis a statisztikusok számára a standardizálás csak az átlag kivonását és a szórással történõ osztást jelenti (vö. pl. Jánossy et al. 1966). Az adatok átalakításának hatását vegetáció-ökológiai kontextusban Austin & Greig-Smith (1968), Noy-Meir (1973)és Noy-Meir et al. (1975)vizsgálták. Bár ezek viszonylag régebbi publikációk, a témával foglalkozó kutatók ma is haszonnal olvashatják. Az ökológiai tárgyú könyvek egy sora, pl. Digby & Kempton (1987), Jongman et al. (1987), Pielou (1984), Ludvig & Reynolds (1988)viszonylag keveset szentel e témának. Orlóci (1978)a változók standardizálását az összemérhetõség szempontjából veszi szemügyre, az objektumok standardizálását pedig úgy vizsgálja, hogy azok milyen hasonlósági ill. távolság-függvényekben (3. fejezet)szerepelnek.
19 Az adatmátrix, az adatok átalakítása táblázat. Adatstruktúrák grafikus illusztrációja és adatok átalakítása különféle programcsomagokban (B függelék). + jelöli a közvetlenül elérhetõ módszert, * pedig a függvény definiálásával, kissé bonyolultabban, változónként külön-külön elvégezhetõ átalakítást. A Kleiner-Hartigan féle fák rajzolására nem találtam programot, a 2.2c ábra kézzel készült. Statistica NT-SYS SYN-TAX BMDP NuCoSA Szórásdiagramokmátrixa + + Rotációs diagram + Chernoff-arcok+ Csillagdiagramok+ Hisztogramok dimenziós persp. rajzok+ + Centrálás * + + * + Terjedelem * + + * Szórás * + Összeg * + + * + Maximum + + * + Normálás + + * Log x * + * + Log (x+1) * + + * + Hatvány (általános formula) * + * + Négyzetgyök* + + * + Négyzetgyök(x+0.5) * + Négyzetre emelés * + + * + Arc sin * + + * Clymo + + Binarizáció + + * + Kettõs centrálás + + * Számítógépes programok A 2.1 táblázat sorolja fel az ebben a fejezetben ismertetett módszereket és jelzi, hogy azok mely programcsomagokban találhatók meg. A programok listája természetesen nem teljes, hiszen lehetetlen lenne minden szóba jöhetõ programcsomagot fellelni és értékelni. Az összeállításban ezért elsõsorban olyan programok szerepelnek, amelyek személyi számítógépeken futtathatók, és Magyarországon már elterjedtek, viszonylag könnyen beszerezhetõk vagy megrendelhetõk, és a könyvben tárgyalt más módszereket is tartalmaznak (B függelék). Reméljük, hogy ezzel is megkönnyítjük az esetleges felhasználók munkáját, bár a táblázat tartalmáért üzleti értelemben nem vállalhatjuk a felelõsséget. Az adatátalakítás stratégiája az egyes programcsomagokban többféle lehet. Nagy adattáblázatokra a Statistica és a BMDP használata viszonylag kényelmetlen, hiszen minden egyes változóra külön-külön kell elvégeznünk a mûveleteket, rendszerint a fõ elemzést megelõzõen. Az NT-SYS pedig nagy mátrixokra is alkalmazható, megtartva azt a lehetõséget, hogy az egyes változókat különféleképpen kezeljük. A SYN-TAX és a NuCoSA viszont egyöntetûen
20 56 2. fejezet alkalmazzák az átalakítást minden változóra, ennek megfelelõen gyors és kényelmes a használatuk. 2.5 Kérdezz - válaszolok K: Mire végigolvastam ezt a fejezetet, már egy kicsit meg is zavarodtam: mikor van szó mintavételi egységrõl, mikor változóról, mikor objektumról; mit lehet felcserélni mivel, és így tovább. Lehet, persze, hogy én vagyok a hibás, de jó lenne még egyszer tisztázni a dolgokat. V: Ez elõl nem zárkózhatom el; én se szeretném ha homályos maradna ez a kérdés. Foglaljuk tehát össze: mintavétel során technikai értelemben beszélünk mintavételi egységekrõl, amelyeket az alapsokaságból kiválasztunk,vagy a kontinuumban elhatárolunk. Ezeket statisztikai értelemben vett változók segítségével írjuk le. Természetesen ezek még nem keverhetõk össze! Az elemzés során a mintavételi egységek helyett viszont már objektumokról beszéltünk, a változókra újabb elnevezést nem kerestünk. Ettõl fogva az attribútum-dualitás elve értelmében az objektumok és változók felcserélhetõk lesznek (kivéve azt a néhány esetet, amikor ennek jogossága vitatható, illetve a szignifikancia próbáknál). K: Amikor elõzetesen megvizsgálom az adataimat, könnyen találhatok olyan változókat, amelyek csak logaritmikus transzformáció után közelítik a normális eloszlást. Ugyanabban a mátrixban más változók viszont eleve normális eloszlásúnak tûnnek. Van-e annak értelme, ha bizonyos változókat átalakítok, másokat pedig nem? V: Ennek nincs elvi akadálya, csak jól át kell gondolnunk, mit is akarunk elérni. Adatok átalakításának, mint láttuk, kétféle célja lehet: a változók súlyozásának megváltoztatása ill. az eloszlás módosítása. A logaritmikus transzformáció egyszerre normalizál és egalizál is, holott meglehet: csak az egyikre lenne szükség. Bizonyos egyensúlyt kell tehát a súlyozás és normalizálás között megteremteni. A többváltozós elemzésben inkább a súlyozás megváltoztatása a fontosabb, ez szinte minden módszernél számításba jöhet. Normalizálásra ritkábban van szükség, s ez egyáltalán nem érinti pl. a klasszifikációs módszereket. Annak, hogy más és más módon alakítjuk át a változókat, persze van egy fontos következménye: a közöttük lévõ kapcsolatok (pl. korreláció) is megváltoznak! Objektumok standardizálását pedig csak a teljes objektumhalmazra egyöntetûen érdemes elvégezni. K: Ha jól értettem az elõzõ fejezet alapján, a térsorelemzés a valós térben a mintavételezés paramétereinek apró megváltoztatásával próbál hasznos következtetésekre jutni. Ebben a fejezetben újabb tereket ismertünk meg, pl. a fajok mint dimenziók alkotta teret. Logikus lenne, ha itt is tudnánk térsorokat definiálni. V: Úgy van. A valós térbeli sorok (vagy sorozatok, ha így jobban tetszik) csak a kezdetet jelentik. Az adatmátrix elkészítésével és a késõbbi elemzések során már elvont, konceptuális terekkel van dolgunk, és sorokat mindegyikben lehet definiálni. Gondoljunk például a Clymo függvény, a logaritmus és a hatványfüggvény c paraméterének, vagy a Box - Cox transzformáció λ paraméterének a fokozatos megváltoztatására. K: Mi lehet ennek az értelme? V: Ahogy a valós térbeli sorok a mintavételezés paraméterei önkényes megválasztásának hatását képesek illusztrálni, az adattérbeli sorok (mondjuk így) pedig az adatátalakítási
21 Az adatmátrix, az adatok átalakítása 57 önkényeskedések hatását mutathatják meg. Pl. a 10-es alapú logaritmus sokkal erõteljesebben redukálja a nagy egyedszámadatokat, mint a természetes alapú, vagy pláne a 2-es alapú logaritmus. A Clymo transzformációsor, amelyet azt hiszem a 2.6 ábra elég szemléletesen illusztrál, jól használható az adattípusok fokozatos változtatására. Megjegyzendõ, hogy mostanában egyre többen vizsgálnak ilyen sorokat, bár nem elegen... K: Ami nyilván senkit sem ment fel a lustaság vádja alól! V: Igen, meg kell sajnos szoknunk, hogy az elemzés során nagyon sok minden saját döntéseinkre van bízva. A mintavételezés, az adattípus és adatátalakítás megtervezése ránk vár. És akkor még nem is említettük a hátralévõ számos választási lehetõséget, amelyekre persze kitérünk a késõbbiekben. Döntéseink hatását egy kicsit komolyabban kellene vennünk, mint eddig, s ilyen irányban a térsorok sokat segíthetnek. Több konkrét példát láthatsz majd a könyv záró fejezetében. K: Nagyon szemléletesnek tartom a fenyõfás ábrát... V: Ennek örülök, de rögtön be kell vallanom, hogy az ötlet bizony nem teljesen eredeti. Egyes transzformációk kombinált hatását illusztrálta malacok alakváltoztatásával a Münch. med. Wschr kötete 13. számának 15. oldala. Be is mutatok neked néhányat, íme: Ezek a rajzok azonban túl jól, túlságosan is mulatságosra sikeredtek, a lényeget a fenyõfák talán jobban láttatják. Az egyes irányokban pedig eltérõ a transzformáció típusa, és ezt nem igazán ajánlom. A változók sokféle átalakítása végül is kavarodást okozhat, de erre már fentebb is utaltam, mikor a normalizálásról kérdeztél.
Általános statisztika II. Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László
Általános statisztika II Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László Általános statisztika II Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László Publication
Matematikai statisztikai elemzések 6.
Matematikai statisztikai elemzések 6. Regressziószámítás: kétváltozós lineáris és nemlineáris regresszió, többváltozós regresszió Prof. Dr. Závoti, József Matematikai statisztikai elemzések 6.: Regressziószámítás:
A gyakorlatok HF-inak megoldása Az 1. gyakorlat HF-inak megoldása. 1. Tagadások:
. Tagadások: A gyakorlatok HF-inak megoldása Az. gyakorlat HF-inak megoldása "Nem észak felé kell indulnunk és nem kell visszafordulnunk." "Nem esik az es, vagy nem fúj a szél." "Van olyan puha szilva,
INTELLIGENS ADATELEMZÉS
Írta: FOGARASSYNÉ VATHY ÁGNES STARKNÉ WERNER ÁGNES INTELLIGENS ADATELEMZÉS Egyetemi tananyag 2011 COPYRIGHT: 2011 2016, Dr. Fogarassyné Dr. Vathy Ágnes, Pannon Egyetem Műszaki Informatikai Kar Matematika
Lineáris programozás. Modellalkotás Grafikus megoldás Feladattípusok Szimplex módszer
Lineáris programozás Modellalkotás Grafikus megoldás Feladattípusok Szimplex módszer Feladat: Egy gyár kétféle terméket gyárt (A, B): /db Eladási ár 1000 800 Technológiai önköltség 400 300 Normaóraigény
Topográfia 7. Topográfiai felmérési technológiák I. Mélykúti, Gábor
Topográfia 7. Topográfiai felmérési technológiák I. Mélykúti, Gábor Topográfia 7. : Topográfiai felmérési technológiák I. Mélykúti, Gábor Lektor : Alabér, László Ez a modul a TÁMOP - 4.1.2-08/1/A-2009-0027
KVANTITATÍV MÓDSZEREK
KVANTITATÍV MÓDSZEREK Dr. Kövesi János Tóth Zsuzsanna Eszter 6 Tartalomjegyzék Kvantitatív módszerek. Valószínűségszámítási tételek. eltételes valószínűség. Események függetlensége.... 3.. eltételes valószínűség...
Ittfoglalomösszea legfontosabbtudnivalókat, részleteka honlapon, illetvea gyakorlatvezetőtől is kaptok információkat.
1 Ittfoglalomösszea legfontosabbtudnivalókat, részleteka honlapon, illetvea gyakorlatvezetőtől is kaptok információkat. A statisztika tanulásához a legtöbb infomrációkat az előadásokon és számítógépes
MATEMATIKA JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ
Matematika emelt szint 0613 ÉRETTSÉGI VIZSGA 007. május 8. MATEMATIKA EMELT SZINTŰ ÍRÁSBELI ÉRETTSÉGI VIZSGA JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ OKTATÁSI ÉS KULTURÁLIS MINISZTÉRIUM Formai előírások: Fontos tudnivalók
Statisztikai módszerek
Statisztikai módszerek A hibaelemzı módszereknél azt néztük, vannak-e kiugró, kritikus hibák, amelyek a szabályozás kivételei. Ezekkel foglalkozni kell; minıségavító szabályozásra van szükség. A statisztikai
Komputer statisztika gyakorlatok
Eszterházy Károly Főiskola Matematikai és Informatikai Intézet Tómács Tibor Komputer statisztika gyakorlatok Eger, 2010. október 26. Tartalomjegyzék Előszó 4 Jelölések 5 1. Mintagenerálás 7 1.1. Egyenletes
Síkban polarizált hullámok síkban polarizált lineárisan polarizált Síkban polarizált hullámok szuperpozíciója cirkulárisan polarizált
Síkban polarizált hullámok Tekintsünk egy z-tengely irányában haladó fénysugarat. Ha a tér egy adott pontjában az idő függvényeként figyeljük az elektromos (ill. mágneses) térerősség vektorokat, akkor
MATEMATIKA FELADATGYŰJTEMÉNY
Pék Johanna MATEMATIKA FELADATGYŰJTEMÉNY Nem matematika alapszakos hallgatók számára Tartalomjegyzék Előszó iii. Lineáris algebra.. Mátrixok...................................... Lineáris egyenletrendszerek..........................
FAUR KRISZTINA BEÁTA, SZAbÓ IMRE, GEOTECHNIkA
FAUR KRISZTINA BEÁTA, SZAbÓ IMRE, GEOTECHNIkA 7 VII. A földművek, lejtők ÁLLÉkONYSÁgA 1. Földművek, lejtők ÁLLÉkONYSÁgA Valamely földművet, feltöltést vagy bevágást építve, annak határoló felületei nem
OBJEKTUMORIENTÁLT TERVEZÉS ESETTANULMÁNYOK. 2.1 A feladat
2. Digitális óra 28 OBJEKTUMORIENTÁLT TERVEZÉS ESETTANULMÁNYOK 2.1 A feladat Ebben a fejezetben egy viszonylag egyszerő problémára alkalmazva tekintjük át az OO tervezés modellezési technikáit. A feladat
Variancia-analízis (folytatás)
Variancia-analízis (folytatás) 6. elıadás (11-12. lecke) Szórás-stabilizáló transzformációk (folyt.), t-próbák 11. lecke További variancia-stabilizáló transzformációk Egy-mintás t-próba Szórás-kiegyenlítı
2. OPTIKA 2.1. Elmélet 2.1.1. Geometriai optika
2. OPTIKA 2.1. Elmélet Az optika tudománya a látás élményéből fejlődött ki. A tárgyakat azért látjuk, mert fényt bocsátanak ki, vagy a rájuk eső fényt visszaverik, és ezt a fényt a szemünk érzékeli. A
4. sz. Füzet. A hibafa számszerű kiértékelése 2002.
M Ű S Z A K I B I Z O N S Á G I F Ő F E L Ü G Y E L E 4. sz. Füzet A hibafa számszerű kiértékelése 00. Sem a Műszaki Biztonsági Főfelügyelet, sem annak nevében, képviseletében vagy részéről eljáró személy
4. LECKE: DÖNTÉSI FÁK - OSZTÁLYOZÁS II. -- Előadás. 4.1. Döntési fák [Concepts Chapter 11]
1 4. LECKE: DÖNTÉSI FÁK - OSZTÁLYOZÁS II. -- Előadás 4.1. Döntési fák [Concepts Chapter 11] A döntési fákon alapuló klasszifikációs eljárás nagy előnye, hogy az alkalmazása révén nemcsak egyedenkénti előrejelzést
(11) Lajstromszám: E 004 597 (13) T2 EURÓPAI SZABADALOM SZÖVEGÉNEK FORDÍTÁSA
!HU000004597T2! (19) HU (11) Lajstromszám: E 004 597 (13) T2 MAGYAR KÖZTÁRSASÁG Magyar Szabadalmi Hivatal EURÓPAI SZABADALOM SZÖVEGÉNEK FORDÍTÁSA (21) Magyar ügyszám: E 04 716248 (22) A bejelentés napja:
AZ OMBUDSMAN ALAPJOG-ÉRTELMEZÉSE ÉS NORMAKONTROLLJA *
Sólyom László AZ OMBUDSMAN ALAPJOG-ÉRTELMEZÉSE ÉS NORMAKONTROLLJA * 1. Ha már ombudsman, akkor rendes közjogi ombudsman legyen mondta Tölgyessy Péter az Ellenzéki Kerekasztal 1989. szeptember 18-i drámai
Herczeg Bálint. Az iskola méretének hatása az iskola hozzáadott értékére. 2015 November 9.
Herczeg Bálint Az iskola méretének hatása az iskola hozzáadott értékére 1 2015 November 9. Az iskola méretének hatása az iskola hozzáadott értékére HÉTFA Mûhelytanulmányok 2015/11 Budapest ISSN 2062-378X
S T A T I K A. Az összeállításban közremûködtek: Dr. Elter Pálné Dr. Kocsis Lászlo Dr. Ágoston György Molnár Zsolt
S T A T I K A Ez az anyag az "Alapítvány a Magyar Felsôoktatásért és Kutatásért" és a "Gépészmérnök Képzésért Alapítvány" támogatásával készült a Mûszaki Mechanikai Tanszéken kísérleti jelleggel, hogy
Elméleti összefoglalók dr. Kovács Péter
Elméleti összefoglalók dr. Kovács Péter 1. Adatállományok létrehozása, kezelése... 2 2. Leíró statisztikai eljárások... 3 3. Várható értékek (átlagok) vizsgálatára irányuló próbák... 5 4. Eloszlások vizsgálata...
Az alap- és a képfelület fogalma, megadási módjai és tulajdonságai
A VETÜLETEK ALAP- ÉS KÉPFELÜLETE Az alap- és a képfelület fogalma, megadási módjai és tulajdonságai A geodézia, a térinformatika és a térképészet a görbült földfelületen elhelyezkedő geometriai alakzatokat
Országos kompetenciamérés. Országos jelentés
Országos kompetenciamérés 2009 Országos jelentés Országos jelentés TARTALOMJEGYZÉK JOGSZABÁLYI HÁTTÉR... 7 A 2009. ÉVI ORSZÁGOS KOMPETENCIAMÉRÉS SZÁMOKBAN... 8 A FELMÉRÉSRŐL... 9 EREDMÉNYEK... 11 AJÁNLÁS...
A.15. Oldalirányban nem megtámasztott gerendák
A.15. Oldalirányban nem megtámasztott gerendák A.15.1. Bevezetés Amikor egy karcsú szerkezeti elemet a nagyobb merevségű síkjában terhelünk, mindig fennáll annak lehetősége, hogy egy hajlékonyabb síkban
Minden az adatról. Csima Judit. 2015. február 11. BME, VIK, Csima Judit Minden az adatról 1 / 41
Minden az adatról Csima Judit BME, VIK, Számítástudományi és Információelméleti Tanszék 2015. február 11. Csima Judit Minden az adatról 1 / 41 Adat: alapfogalmak Adathalmaz elvileg bármi, ami információt
Ferde fényképezés. Szalkai István Pannon Egyetem, Veszprém, szalkai@almos.uni-pannon.hu. June 18, 2015
Ferde fényképezés Szalkai István Pannon Egyetem, Veszprém, szalkai@almos.uni-pannon.hu June 18, 2015 Haladvány Kiadvány, 2015. http://www.math.bme.hu/~hujter/halad.htm/150619.pdf Legtöbbször nem tudjuk
Csicsman József-Sipos Szabó Eszter csicsman@calculus.hu, siposeszti@gmail.com. Matematikai alapok az adatbányászati szoftverek első megismeréséhez
Csicsman József-Sipos Szabó Eszter csicsman@calculus.hu, siposeszti@gmail.com Matematikai alapok az adatbányászati szoftverek első megismeréséhez 1.1 A statisztikai sokaság A statisztika a valóság számszerű
MINİSÉGSZABÁLYOZÁS. Dr. Drégelyi-Kiss Ágota e-mail: dregelyi.agota@bgk.uni-obuda.hu http://uni-obuda.hu/users/dregelyia
MINİSÉGSZABÁLYOZÁS A GÉPIPARBAN Dr. Drégelyi-Kiss Ágota e-mail: dregelyi.agota@bgk.uni-obuda.hu http://uni-obuda.hu/users/dregelyia ISO 9000:2008 A STATISZTIKAI MÓDSZEREK HASZNÁLATÁRÓL A statisztikai módszerek
EGÉSZSÉGÜGYI DÖNTÉS ELŐKÉSZÍTŐ
EGÉSZSÉGÜGYI DÖNTÉS ELŐKÉSZÍTŐ MODELLEZÉS Brodszky Valentin, Jelics-Popa Nóra, Péntek Márta BCE Közszolgálati Tanszék A tananyag a TÁMOP-4.1.2/A/2-10/1-2010-0003 "Képzés- és tartalomfejlesztés a Budapesti
statisztikai menürendszere Dr. Vargha András 2007
A statisztikai menürendszere Dr. Vargha András 2007 2 tartalomjegyzék 1. Alapok (egymintás elemzések Alapstatisztikák Részletesebb statisztikák számítása Gyakorisági eloszlás, hisztogram készítése Középértékekre
Ha vasalják a szinusz-görbét
A dolgozat szerzőjének neve: Szabó Szilárd, Lorenzovici Zsombor Intézmény megnevezése: Bolyai Farkas Elméleti Líceum Témavezető tanár neve: Szász Ágota Beosztása: Fizika Ha vasalják a szinusz-görbét Tartalomjegyzék
és élelmiszer-ipari termékek hozhatók forgalomba, amelyeket a vonatkozó jogszabá-
152 - - - - - - Az öko, a bio vagy az organikus kifejezések használata még napjainkban sem egységes, miután azok megjelenési formája a mindennapi szóhasználatban országon- A német, svéd, spanyol és dán
1. gy. SÓ OLDÁSHŐJÉNEK MEGHATÁROZÁSA. Kalorimetriás mérések
1. gy. SÓ OLDÁSHŐJÉNEK MEGHATÁROZÁSA Kalorimetriás mérések A fizikai és kémiai folyamatokat energiaváltozások kísérik, melynek egyik megnyilvánulása a hőeffektus. A rendszerben ilyen esetekben észlelhető
Kosztolányi József Kovács István Pintér Klára Urbán János Vincze István. tankönyv. Mozaik Kiadó Szeged, 2013
Kosztolányi József Kovács István Pintér Klára Urbán János Vincze István tankönyv 0 Mozaik Kiadó Szeged, 03 TARTALOMJEGYZÉK Gondolkodási módszerek. Mi következik ebbõl?... 0. A skatulyaelv... 3. Sorba rendezési
Tevékenység: Olvassa el a fejezetet! Gyűjtse ki és jegyezze meg a ragasztás előnyeit és a hátrányait! VIDEO (A ragasztás ereje)
lvassa el a fejezetet! Gyűjtse ki és jegyezze meg a ragasztás előnyeit és a hátrányait! VIDE (A ragasztás ereje) A ragasztás egyre gyakrabban alkalmazott kötéstechnológia az ipari gyakorlatban. Ennek oka,
A rádió* I. Elektromos rezgések és hullámok.
A rádió* I. Elektromos rezgések és hullámok. A legtöbb test dörzsölés, nyomás következtében elektromos töltést nyer. E töltéstől függ a test elektromos feszültsége, akárcsak a hőtartalomtól a hőmérséklete;
8. előadás EGYÉNI KERESLET
8. előadás EGYÉNI KERESLET Kertesi Gábor Varian 6. fejezete, enyhe változtatásokkal 8. Bevezető megjegyzések Az elmúlt héten az optimális egyéni döntést elemeztük grafikus és algebrai eszközökkel: a preferenciatérkép
Növelhető-e a csőd-előrejelző modellek előre jelző képessége az új klasszifikációs módszerek nélkül?
Közgazdasági Szemle, LXI. évf., 2014. május (566 585. o.) Nyitrai Tamás Növelhető-e a csőd-előrejelző modellek előre jelző képessége az új klasszifikációs módszerek nélkül? A Bázel 2. tőkeegyezmény bevezetését
A KÖRNYEZETI INNOVÁCIÓK MOZGATÓRUGÓI A HAZAI FELDOLGOZÓIPARBAN EGY VÁLLALATI FELMÉRÉS TANULSÁGAI
A KÖRNYEZETI INNOVÁCIÓK MOZGATÓRUGÓI A HAZAI FELDOLGOZÓIPARBAN EGY VÁLLALATI FELMÉRÉS TANULSÁGAI Széchy Anna Zilahy Gyula Bevezetés Az innováció, mint versenyképességi tényező a közelmúltban mindinkább
MATEMATIKA JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ
Matematika középszint 1413 ÉRETTSÉGI VIZSGA 015. május 5. MATEMATIKA KÖZÉPSZINTŰ ÍRÁSBELI ÉRETTSÉGI VIZSGA JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ EMBERI ERŐFORRÁSOK MINISZTÉRIUMA Fontos tudnivalók Formai előírások:
6. RADIOAKTIVITÁS ÉS GEOTERMIKA
6. RADIOAKTIVITÁS ÉS GEOTERMIKA Radioaktivitás A tapasztalat szerint a természetben előforduló néhány elem bizonyos izotópjai nem stabilak, hanem minden külső beavatkozástól mentesen radioaktív sugárzás
Regressziószámítás alkalmazása kistérségi adatokon
Lengyel I. Lukovics M. (szerk.) 2008: Kérdıjelek a régiók gazdasági fejlıdésében. JATEPress, Szeged, 264-287. o. Regressziószámítás alkalmazása kistérségi adatokon Szakálné Kanó Izabella 1 A lokális térségek
V. A MIKROSZKÓP. FÉNYMIKROSZKÓPOS VIZSGÁLATOK A MIKROSZKÓP FELÉPÍTÉSE ÉS MŐKÖDÉSE
V. A MIKROSZKÓP. FÉNYMIKROSZKÓPOS VIZSGÁLATOK A MIKROSZKÓP FELÉPÍTÉSE ÉS MŐKÖDÉSE Minden olyan optikai eszközt, amely arra szolgál, hogy a tiszta látás távolságán belül megnövelje a látószöget abból a
9. Áramlástechnikai gépek üzemtana
9. Áramlástechnikai gépek üzemtana Az üzemtan az alábbi fejezetekre tagozódik: 1. Munkapont, munkapont stabilitása 2. Szivattyú indítása soros 3. Stacionárius üzem kapcsolás párhuzamos 4. Szivattyú üzem
11. Matematikai statisztika
11. Matematikai statisztika 11.1. Alapfogalmak A statisztikai minta valamely valószínűségi változóra vonatkozó véges számú független kisérlet eredménye. Ez véges sok, azonos eloszlású valószínűségi változó
A.11. Nyomott rudak. A.11.1. Bevezetés
A.. Nyomott rudak A... Bevezetés A nyomott szerkezeti elem fogalmat általában olyan szerkezeti elemek jelölésére használjuk, amelyekre csak tengelyirányú nyomóerő hat. Ez lehet speciális terhelésű oszlop,
Matematika 8. PROGRAM. általános iskola 8. osztály nyolcosztályos gimnázium 4. osztály hatosztályos gimnázium 2. osztály. Átdolgozott kiadás
Dr. Czeglédy István fôiskolai tanár Dr. Czeglédy Istvánné vezetôtanár Dr. Hajdu Sándor fôiskolai docens Novák Lászlóné tanár Dr. Sümegi Lászlóné szaktanácsadó Zankó Istvánné tanár Matematika 8. PROGRAM
Helyi tanterv. Batthyány Kázmér Gimnázium Matematika emelt (5+6+6+6 óra/hét) 9-12 évfolyam Készült: 2013 február
Helyi tanterv Batthyány Kázmér Gimnázium Matematika emelt (5+6+6+6 óra/hét) 9-12 évfolyam Készült: 2013 február 1 A TANTERV SZERKEZETE Bevezető Célok és feladatok Fejlesztési célok és kompetenciák Helyes
TARTALOMJEGYZÉK ELŐSZÓ... 7 1. GONDOLKOZZ ÉS SZÁMOLJ!... 9 2. HOZZÁRENDELÉS, FÜGGVÉNY... 69
TARTALOMJEGYZÉK ELŐSZÓ............................................................ 7 1. GONDOLKOZZ ÉS SZÁMOLJ!............................. 9 Mit tanultunk a számokról?............................................
matematikai statisztika 2006. október 24.
Valószínűségszámítás és matematikai statisztika 2006. október 24. ii Tartalomjegyzék I. Valószínűségszámítás 1 1. Véletlen jelenségek matematikai modellje 3 1.1. Valószínűségi mező..............................
A SZÉL ENERGETIKAI CÉLÚ JELLEMZÉSE, A VÁRHATÓ ENERGIATERMELÉS
1 A SZÉL ENERGETIKAI CÉLÚ JELLEMZÉSE, A VÁRHATÓ ENERGIATERMELÉS Dr. Tóth László egyetemi tanár Schrempf Norbert PhD Tóth Gábor PhD Szent István Egyetem Eloszó Az elozoekben megjelent cikkben szóltunk a
2. előadás: További gömbi fogalmak
2 előadás: További gömbi fogalmak 2 előadás: További gömbi fogalmak Valamely gömbi főkör ívének α azimutja az ív egy tetszőleges pontjában az a szög, amit az ív és a meridián érintői zárnak be egymással
Kvantitatív Makyoh-topográfia 2002 2006, T 037711
ZÁRÓJELENTÉS Kvantitatív Makyoh-topográfia 2002 2006, T 037711 Témavezető: Riesz Ferenc 2 1. Bevezetés és célkitűzés; előzmények A korszerű félvezető-technológiában alapvető fontosságú a szeletek felületi
Készítette: niethammer@freemail.hu
VLogo VRML generáló program Készítette: Niethammer Zoltán niethammer@freemail.hu 2008 Bevezetés A VLogo az általános iskolákban használt Comenius Logo logikájára épülő programozási nyelv. A végeredmény
15. BESZÉD ÉS GONDOLKODÁS
15. BESZÉD ÉS GONDOLKODÁS 1. A filozófiának, a nyelvészetnek és a pszichológiának évszázadok óta visszatérô kérdése, hogy milyen a kapcsolat gondolkodás vagy általában a megismerési folyamatok és nyelv,
ÁBRÁZOLÓ GEOMETRIA. Csavarvonal, csavarfelületek. Összeállította: Dr. Geiger János. Gépészmérnöki és Informatikai Kar MISKOLCI EGYETEM
ÁBRÁZOLÓ GEOMETRIA Csavarvonal, csavarfelületek Összeállította: Dr. Geiger János Gépészmérnöki és Informatikai Kar MISKOLCI EGYETEM 2014 TARTALOM 1. A munkafüzet célja, területei, elsajátítható kompetenciák...
Doktori munka. Solymosi József: NUKLEÁRIS KÖRNYEZETELLENŐRZŐ MÉRŐRENDSZEREK. Alkotás leírása
Doktori munka Solymosi József: NUKLEÁRIS KÖRNYEZETELLENŐRZŐ MÉRŐRENDSZEREK Alkotás leírása Budapest, 1990. 2 KÖSZÖNETNYILVÁNÍTÁS A doktori munka célja az egyéni eredmény bemutatása. Feltétlenül hangsúlyoznom
Megjelent: Magyar Földrajzi Konferencia tudományos közleményei (CD), Szeged, 2001
Megjelent: Magyar Földrajzi Konferencia tudományos közleményei (CD), Szeged, 2001 A területi lehatárolások statisztikai következményei A területi lehatárolások statisztikai következményeinek megközelítése
MATEMATIKA TAGOZAT 5-8. BEVEZETŐ. 5. évfolyam
BEVEZETŐ Ez a helyi tanterv a kerettanterv Emelet matematika A változata alapján készült. Az emelt oktatás során olyan tanulóknak kívánunk magasabb szintű ismerteket nyújtani, akik matematikából átlag
Felügyelet nélküli, távtáplált erősítő állomások tartályainak általánosított tömítettségvizsgálati módszerei
Felügyelet nélküli, távtáplált erősítő állomások tartályainak általánosított tömítettségvizsgálati módszerei A félvezető elemek bevezetése, illetve alkalmazása forradalmi változást idézett elő a vivőfrekvenciás
MATEMATIKA 9. osztály Segédanyag 4 óra/hét
MATEMATIKA 9. osztály Segédanyag 4 óra/hét - 1 - Az óraszámok az AROMOBAN követhetőek nyomon! A tananyag feldolgozása a SOKSZÍNŰ MATEMATIKA (Mozaik, 013) tankönyv és a SOKSZÍNŰ MATEMATIKA FELADATGYŰJTEMÉNY
(11) Lajstromszám: E 003 621 (13) T2 EURÓPAI SZABADALOM SZÖVEGÉNEK FORDÍTÁSA
!HU000003621T2! (19) HU (11) Lajstromszám: E 003 621 (13) T2 MAGYAR KÖZTÁRSASÁG Magyar Szabadalmi Hivatal EURÓPAI SZABADALOM SZÖVEGÉNEK FORDÍTÁSA (21) Magyar ügyszám: E 03 717071 (22) A bejelentés napja:
Bemenet modellezése II.
Bemenet modellezése II. Vidács Attila 2005. november 3. Hálózati szimulációs technikák, 2005/11/3 1 Kiszolgálási id k modellezése Feladat: Egy bemeneti modell felállítása egy egy kiszolgálós sorbanállási
MISKOLC MJV ENERGETIKAI KONCEPCIÓJA
MISKOLC MJV ENERGETIKAI KONCEPCIÓJA REV.0. Munkaszám: 7795 Budapest, 2002 július Tartalomjegyzék Vezetői összefoglaló...4 Bevezetés...11 Néhány szó a városról...12 A város energetikája számokban: energiamérleg...13
Elektromágneses hullámok, a fény
Elektromágneses hullámok, a fény Az elektromos töltéssel rendelkező testeknek a töltésük miatt fellépő kölcsönhatását az elektromos és mágneses tér segítségével írhatjuk le. A kölcsönhatás úgy működik,
Matematikai statisztikai elemzések 1.
Matematikai statisztikai elemzések 1. A statisztika alapfogalmai, feladatai, Prof. Dr. Závoti, József Matematikai statisztikai elemzések 1.: A statisztika alapfogalmai, feladatai, statisztika, osztályozás,
Mintapéldák és gyakorló feladatok
Mintapéldák és gyakorló feladatok Közgazdaságtan II. (Makroökonómia) címû tárgyból mérnök és jogász szakos hallgatók számára Az alábbi feladatok a diasorozatokon található mintapéldákon túl további gyakorlási
Ingatlanvagyon értékelés
Nyugat-Magyarországi Egyetem Geoinformatikai Kar Ingatlanfejlesztı 8000 Székesfehérvár, Pirosalma u. 1-3. Szakirányú Továbbképzési Szak Ingatlanvagyon értékelés 4. A vagyon elemzése Szerzı: Harnos László
A lineáris programozás 1 A geometriai megoldás
A lineáris programozás A geometriai megoldás Készítette: Dr. Ábrahám István A döntési, gazdasági problémák optimalizálásának jelentős részét lineáris programozással oldjuk meg. A módszer lényege: Az adott
MATEMATIKA I. RÉSZLETES ÉRETTSÉGI VIZSGAKÖVETELMÉNY A) KOMPETENCIÁK
MATEMATIKA I. RÉSZLETES ÉRETTSÉGI VIZSGAKÖVETELMÉNY Az érettségi követelményeit két szinten határozzuk meg: - középszinten a mai társadalomban tájékozódni és alkotni tudó ember matematikai ismereteit kell
Bírálat. Farkas András
Bírálat Farkas András Közlekedési rendszerek fejlesztése és értékelése többtényezős döntési eljárások felhasználásával (Appraisal and Development of Transportation Systems Using Multiple Criteria Decision
MIKROÖKONÓMIA I. Készítette: K hegyi Gergely és Horn Dániel. Szakmai felel s: K hegyi Gergely. 2010. június
MIKROÖKONÓMIA I Készült a TÁMOP-412-08/2/a/KMR-2009-0041 pályázati projekt keretében Tartalomfejlesztés az ELTE TáTK Közgazdaságtudományi Tanszékén az ELTE Közgazdaságtudományi Tanszék az MTA Közgazdaságtudományi
Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 6. MA3-6 modul. A statisztika alapfogalmai
Nyugat-magyarországi Egyetem Geoinformatikai Kara Prof. Dr. Závoti József Matematika III. 6. MA3-6 modul A statisztika alapfogalmai SZÉKESFEHÉRVÁR 2010 Jelen szellemi terméket a szerzői jogról szóló 1999.
Megjelenítési funkciók
Pap Lőrinc 2010. április 19. Megjelenítési funkciók A ma használatos Földrajzi Információs Rendszerek (geographic information system, GIS) egyik funkciója még mindig a hardcopy térképek előállítása. Ezzel
A TÖMEGKÖZLEKEDÉSI KÖZSZOLGÁLTATÁS SZOLGÁLTATÓ JELLEGÉNEK MEGALAPOZÁSA: MEGÁLLÓHELY ELLÁTOTTSÁG BUDAPESTEN. Összefoglaló
RUZSÁNYI TIVADAR A TÖMEGKÖZLEKEDÉSI KÖZSZOLGÁLTATÁS SZOLGÁLTATÓ JELLEGÉNEK MEGALAPOZÁSA: MEGÁLLÓHELY ELLÁTOTTSÁG BUDAPESTEN Összefoglaló A tanulmányban a tömegközlekedés igénybevételének alapvető feltételét,
(11) Lajstromszám: E 005 463 (13) T2 EURÓPAI SZABADALOM SZÖVEGÉNEK FORDÍTÁSA. (51) Int. Cl.: B65D 1/16 (2006.01)
!HU00000463T2! (19) HU (11) Lajstromszám: E 00 463 (13) T2 MAGYAR KÖZTÁRSASÁG Magyar Szabadalmi Hivatal EURÓPAI SZABADALOM SZÖVEGÉNEK FORDÍTÁSA (21) Magyar ügyszám: E 0 7064 (22) A bejelentés napja: 0.
Sztochasztikus folyamatok 1. házi feladat
Sztochasztikus folyamatok 1. házi feladat 1. Egy borfajta alkoholtartalmának meghatározására méréseket végzünk. Az egyes mérések eredményei egymástól független valószínûségi változók, melyek normális eloszlásúak,
Tető nem állandó hajlású szarufákkal
1 Tető nem állandó hajlású szarufákkal Már korábbi dolgozatainkban is szó volt a címbeli témáról. Most azért vettük újra elő, mert szép és érdekes ábrákat találtunk az interneten, ezzel kapcsolatban, és
Tűgörgős csapágy szöghiba érzékenységének vizsgálata I.
Budapesti Műszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Tudományos Diákköri Konferencia Tűgörgős csapágy szöghiba érzékenységének vizsgálata I. Szöghézag és a beépítésből adódó szöghiba vizsgálata
BUDAPESTI KÖZGAZDASÁGTUDOMÁNYI EGYETEM. Puskás Csaba, Szabó Imre, Tallos Péter LINEÁRIS ALGEBRA JEGYZET
BUDAPESTI KÖZGAZDASÁGTUDOMÁNYI EGYETEM Puskás Csaba, Szabó Imre, Tallos Péter LINEÁRIS ALGEBRA JEGYZET BUDAPEST, 1997 A szerzők Lineáris Algebra, illetve Lineáris Algebra II c jegyzeteinek átdolgozott
7. VIZES OLDATOK VISZKOZITÁSÁNAK MÉRÉSE OSTWALD-FENSKE-FÉLE VISZKOZIMÉTERREL
7. VIZES OLDATOK VISZKOZITÁSÁNAK MÉRÉSE OSTWALD-FENSKE-FÉLE VISZKOZIMÉTERREL Számos technológiai folyamat, kémiai reakció színtere gáz, vagy folyékony közeg (fluid közeg). Gondoljunk csak a fémek előállításakor
1. sz. füzet 2001-2005.
M A G Y A R M Ű S Z A K I B I Z T O N S Á G I H I V A T A L 1. sz. füzet A 2/2001. (I. 17.) Korm. rendelet alapján összeállított biztonsági jelentés, illetőleg biztonsági elemzés hatóságnak megküldendő
Lemezgrafitos vasöntvények visszamaradó öntési feszültségének mérése és véges elemes szimulációja
Lemezgrafitos vasöntvények visszamaradó öntési feszültségének mérése és véges elemes szimulációja Dr. Molnár Dániel Miskolci Egyetem, Műszaki Anyagtudományi Kar, Metallurgiai és Öntészeti Intézet daniel.molnar@uni-miskolc.hu
ÉS TESZTEK A DEFINITSÉG
MÁTRIX DEFINITSÉGÉNEK FOGALMA ÉS TESZTEK A DEFINITSÉG ELDÖNTÉSÉRE DR. NAGY TAMÁS egyetemi docens Miskolci Egyetem Alkalmazott Matematikai Tanszék A bemutatott kutató munka a TÁMOP-..1.B-10//KONV-010-0001
Az enyhe értelmi fogyatékos fővárosi tanulók 2009/2010. tanévi kompetenciaalapú matematika- és szövegértés-mérés eredményeinek elemzése
E L E M Z É S Az enyhe értelmi fogyatékos fővárosi tanulók 2009/2010. tanévi kompetenciaalapú matematika- és szövegértés-mérés eredményeinek elemzése 2010. szeptember Balázs Ágnes (szövegértés) és Magyar
MUNKAANYAG. Szám János. Síkmarás, gépalkatrész befoglaló méreteinek és alakjának kialakítása marógépen. A követelménymodul megnevezése:
Szám János Síkmarás, gépalkatrész befoglaló méreteinek és alakjának kialakítása marógépen A követelménymodul megnevezése: Általános gépészeti technológiai feladatok II. (forgácsoló) A követelménymodul
Kvantumkriptográfia III.
LOGO Kvantumkriptográfia III. Gyöngyösi László BME Villamosmérnöki és Informatikai Kar Tantárgyi weboldal: http://www.hit.bme.hu/~gyongyosi/quantum/ Elérhetőség: gyongyosi@hit.bme.hu A kvantumkriptográfia
Szakdolgozat GYIK. Mi az a vázlat?
Szakdolgozat GYIK szerző: Pusztai Csaba, adjunktus, Közgazdaságtan és Jog Tanszék, EKF, Eger Mi az a vázlat? Elvárásként szerepel a GTI szempontrendszerében az, hogy az őszi félévben a szakdolgozó elkészítsen
GAZDASÁGI STATISZTIKA
GAZDASÁGI STATISZTIKA Dr. Kun István GÁBOR DÉNES FŐISKOLA Tantárgy: Gazdasági statisztika Kódszám: 224 Lapszám: 1 TÉMAKÖRÖK A STATISZTIKA ALAPFOGALMAI STATISZTIKAI SOROK STATISZTIKAI TÁBLÁK ÖSSZETETT VISZONYSZÁMOK
6. AZ EREDMÉNYEK ÉRTELMEZÉSE
6. AZ EREDMÉNYEK ÉRTELMEZÉSE A kurzus anyagát felhasználva összeállíthatunk egy kitűnő feladatlapot, de még nem dőlhetünk nyugodtan hátra. Diákjaink teljesítményét még osztályzatokra kell átváltanunk,
Matematika III. 8. A szórás és a szóródás egyéb mérőszámai Prof. Dr. Závoti, József
Matematika III. 8. A szórás és a szóródás egyéb Prof. Dr. Závoti, József Matematika III. 8. : A szórás és a szóródás egyéb Prof. Dr. Závoti, József Lektor : Bischof, Annamária Ez a modul a TÁMOP - 4.1.2-08/1/A-2009-0027
Dr. Kuczmann Miklós JELEK ÉS RENDSZEREK
Dr. Kuczmann Miklós JELEK ÉS RENDSZEREK Dr. Kuczmann Miklós JELEK ÉS RENDSZEREK Z UNIVERSITAS-GYŐR Kht. Győr, 25 SZÉCHENYI ISTVÁN EGYETEM MŰSZAKI TUDOMÁNYI KAR TÁVKÖZLÉSI TANSZÉK Egyetemi jegyzet Írta:
Bevezető Mi a statisztika? Mérés Feldolgozás Adatok rendezése Adatok jellemzése Időbeli elemzés Feladatok. Statisztika I.
Statisztika I. 1. előadás: A statisztika alapfogalmai Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Óbudai Egyetem A kurzusról A kurzus célja
BUDAPESTI MŰSZAKI ÉS GAZDASÁGTUDOMÁNYI EGYETEM ÁRAMLÁSTAN TANSZÉK TOMPA TESTEK ELLENÁLLÁSTÉNYEZŐJÉNEK VIZSGÁLATA MÉRÉSI SEGÉDLET. 2013/14. 1.
BUDAPESTI MŰSZAKI ÉS GAZDASÁGTUDOMÁNYI EGYETEM ÁRAMLÁSTAN TANSZÉK M1 TOMPA TESTEK ELLENÁLLÁSTÉNYEZŐJÉNEK VIZSGÁLATA MÉRÉSI SEGÉDLET 013/14. 1. félév 1. Elméleti összefoglaló A folyadékáramlásban lévő,
Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma) Gráfelmélet II. Gráfok végigjárása
Gráfelmélet II. Gráfok végigjárása DEFINÍCIÓ: (Séta) A G gráf egy olyan élsorozatát, amelyben a csúcsok és élek többször is szerepelhetnek, sétának nevezzük. Egy lehetséges séta: A; 1; B; 2; C; 3; D; 4;
2.3. A rendez pályaudvarok és rendez állomások vonat-összeállítási tervének kidolgozása...35 2.3.1. A vonatközlekedési terv modellje...37 2.3.2.
TARTALOMJEGYZÉK BEVEZETÉS...5 1. ÁRU ÉS KOCSIÁRAMLATOK TERVEZÉSE...6 1.1. A vonatközlekedési terv fogalma, jelent sége és kidolgozásának fontosabb elvei...6 1.2. A kocsiáramlatok és osztályozásuk...7 1.2.1.
I. Gondolkodási módszerek: (6 óra) 1. Gondolkodási módszerek, a halmazelmélet elemei, a logika elemei. 1. Számfogalom, műveletek (4 óra)
MATEMATIKA NYEK-humán tanterv Matematika előkészítő év Óraszám: 36 óra Tanítási ciklus 1 óra / 1 hét Részletes felsorolás A tananyag felosztása: I. Gondolkodási módszerek: (6 óra) 1. Gondolkodási módszerek,