KLASZTEREZÉS I. -- Előadás. A klaszterezés feladata és algoritmusai [Concepts 7]
|
|
- Bence Lukács
- 5 évvel ezelőtt
- Látták:
Átírás
1 1 KLASZTEREZÉS I. -- Előadás A klaszterezés feladata és algoritmusai [Concepts 7] A klaszterezés lényege, hogy előre nem definiált csoportokra szeretnénk osztani az adatainkat. Ennyiben tehát eltér az alapfeladat a felügyelt osztályozástól (pl. karakterfelismerés), ahol előre megadott osztályokba soroljuk a megfigyeléseinket. A klaszterezési algoritmusok száma szinte végtelen, hiszen nemcsak az osztályok kialakításának módja kérdéses, hanem az a távolságfogalom is, ami alapján a csoportok közelségét mérjük, illetve ahogyan meghatározzuk a klaszterezés tulajdonságait. Az eljárások két nagy csoportra oszthatóak. Egy részük rögzített klaszterszámmal dolgozik (partícionáló módszerek), más részük pedig hierarchikus, azaz fokozatosan növeli a klaszterszámot 1-től n-ig ahol n a csoportosítandó megfigyelések száma, vagy ami ezzel ekvivalens, csökkenti n-től 1-ig. Akármelyik típust is válasszuk, a klaszterszám megválasztása is a mi feladatunk. Ehhez számos statisztika, eljárás nyújt segítséget, de telesen automatikus eljárásra nem számíthatunk. Partícionáló módszerek Ezek közül a legismertebb a k-közép eljárás és változatai. Itt k jelöli a klaszterszámot, amit bemenő paraméterként meg kell adnunk. A kezdeti klaszterekbe iteratívan soroljuk be a megfigyeléseket, majd addig folytatjuk az algoritmust, amíg még adott küszöbnél több változás történt a megelőző ciklusban. Ez a módszer távolságalapú, ami nagyon nagy adathalmazoknál problémát jelenthet. A probléma áthidalására különböző mintavételes technikákat javasoltak a szakirodalomban, ennek az Oracle által javasolt innovatív verziójára (O-klaszter) a későbbiekben visszatérünk. Hierarchikus módszerek Itt minden lépésben megkeressük a legközelebbi két klasztert, feljegyezzük a távolságukat és összevonjuk őket. A kapott fa-gráfot a távolság függvényében ábrázolva kapjuk az úgynevezett dendrogramot. Ez a grafikon azonban csak nem túl nagy esetszám esetén áttekinthető. Ha sok megfigyelésünk van, akkor csak a távolságok alapján tudunk klaszterszámot választani. Ráadásul az algoritmus nagy mintaelemszámra igen lassúvá válhat. Az ODM-ben implementált módszer bár k-közép néven jegyzik, valójában hierarchikus módszer. A klaszterszámot minden lépésben eggyel növeli oly módon, hogy a legnagyobb szóródást mutató klasztert bontja két részre. Itt is kapunk valószínűségeket az egyes klaszterekhez történő tartozásra. Ha a dimenziószám (a változók száma) nagy, akkor a tér viszonylagos üressége miatt a legkisebb távolságok is naggyá válhatnak, ami a távolság-alapú módszerek eredményességét nagyban csökkenti. Ezért is indokolt volt a következő pontban bemutatásra kerülő algoritmus kifejlesztése.
2 2 O-klaszter [Concepts 17] Az Oracle ezeken a klasszikus módszereken kívül saját fejlesztésű algoritmust is használ, az úgynevezett O-klaszter eljárás a rácspontokat használja (az elnevezés az ortogonális szóból ered). Ennek során a klaszterszámot sem kell a felhasználónak megadni, azt az eljárás automatikusan javasolja. A felbontás sűrűség-alapú: elhagyja a nagyon kevés megfigyelést tartalmazó téglákat, és összevonja egy klaszterré a szomszédos, nagy sűrűségű téglákat. A módszer lelke itt is a korábban már látott szeparáló hipersík, melynek megtalálásához nincs is feltétlenül szükség a teljes adatbázisra, hanem elegendő egy úgynevezett aktív mintavételezéssel kiválasztott minta. Ez nagy adathalmaz esetén feltétlenül előnyös. Az ortogonalitás azt jelenti, hogy a szeparáló hipersík legyen merőleges az adathalmazunk alkalmas vetületére. Ez a szeparáció a hisztogramon alapul: megfelelően megválasztott csoport-szám esetén kiválasztható az a ritka terület (például chi-négyzet statisztikával ellenőrizve, hogy valóban szignifikánsan ritkább az adott rész a várt átlagos gyakoriságnál), ami nagy sűrűségű részek közé esik, megfelelő helyet biztosítva a hipersíknak. Ha a statisztika nem szignifikáns az adott szinten, de kicsit nagyobb bizonytalanság mellett már igen, akkor új mintaelemek hozzávételével van esély a szignifikancia elérésére. Ha még ilyen szinten sem mutatkozik eltérés a hisztogramban, akkor az adott projekció fagyott (frozen) lesz és nem szerepel a további felbontásokban. Az eljárás akkor ér véget, ha már minden új hisztogram csak fagyott eredményt ad. Egy külön paraméter állítja be a szenzitivitást, azaz azt, hogy mennyire engedjük meg a sok kicsi klaszter keletkezését (hasonlóan az Opti-Grid algoritmushoz). Belátható, hogy az algoritmus lépésszáma lineárisan változik a minta elemszámával és a dimenzióval is. Az algoritmus különösen jól működik magasabb dimenzióban és robusztus az adatok között felbukkanó zajra: olyan példák is konstruálhatóak, ahol akkor is helyesen megtalálja szinte az összes klasztert, ha a megfigyelések szóródásának 90%-a zaj, azaz egyszerű véletlen vektor. Az ODM hierarchikus klaszterezési algoritmust használ. A végeredményként adódó klaszterek a fagráf levelei. Minden klaszter definíciója logikai állítások kombinációjával adható meg. A klaszterezés diagnosztikája kevésbé nyilvánvaló, mint az eddig látott többi módszeré. Az adott klaszterhez való tartozást ugyanis nem lehet egyértelműen eldönteni a tesztadatbázison sem. Ezért az arányskálán mért változók esetén néhány leíró statisztikát érdemes kiszámolni, amelyből a klaszterek kiterjedését, középpontját olvashatjuk le. Mivel azonban itt tipikusan nem ilyen változókkal találkozunk, ezért az ODM ábrázolja a klaszterenkénti hisztogramot, amely minden esetben informatív. A klaszterek centroidját az arányskálán mért változók átlaga és a nominális változók adott klaszterbeli módusza határozza meg. A felépített klaszter-modell alapján mód van a teszt-adatbázis klaszterezésére is (szükség esetén Bayes-féle valószínűségi modell alkalmazásával). Az új megfigyelések score-ja az egyes klaszterekhez történő tartozásuk valószínűségét adja meg.
3 3 -- Gyakorlat O-klaszter megvalósítása [Tutorial 10] Tekintsük először az O-klaszter algoritmust. Itt is a szokásos Mining_Data_Build_V adatbázist használjuk, a Cust_ID azonosítóval. A következő oldalon érdemes áttekinteni, hogy minden változót a megfelelő típusként használjuk-e (pl. a kor folytonos változó kell, hogy legyen). Miután nevet adtunk az elemzésünknek, már a szokásos Advanced option lehetőségekhez is értünk. A mintavételezés és a kiugró érték-kezelés ugyanaz, mint a korábbi algoritmusoknál. A diszkretizálási lehetőségek pedig külön-külön választhatók meg a numerikus és a kategorikus változókra. Az előbbieknél választhatjuk az egyenlő szélességű csoportokat vagy a kvantilis-elven történő csoportosítást, míg az utóbbiaknál a Top N binning módszert alkalmazhatjuk. Ha előzetesen manuálisan elvégeztük az adatelőkészítést, akkor kapcsoljuk ki ezt a beállítást. Végül a modell paraméterei: a maximális klaszterszám jelentése értelemszerű érdemes ezt a várt klaszterszámnál nagyobbra választani. Az érzékenység (sensitivity) növelése a klaszterszám növelése irányába hat, azaz ekkor kisebb véletlenszerű sűrűség- ingadozásokat is klaszterként fog az algoritmus azonosítani. A maximális buffer méret növelésére akkor lehet szükség, ha azt tapasztaljuk, hogy a program túl lassan fut le. A kapott eredmények összefoglalását a következő táblázat mutatja táblázat. Az O-klaszter eljárás eredménye
4 4 Látható a klaszterek hierarchikus felépítése: az 1. klaszter a teljes adatbázis (1500 elem). Ezt először két részre bontotta az algoritmus a foglalkozás alapján (2., 3. klaszter). Ezután a 2. számút bontotta tovább a 10. és 11. sorszámúra, és ez utóbbi már így is maradt (ez levele a kapott fadiagramnak). A végeredményben tehát 10 klaszter keletkezett. Ha kíváncsiak vagyunk az egyes klaszterek tulajdonságaira, akkor csak az adott klaszter sorszámára kattintva és a details (részletek) menüpontra kattintva a felnyíló ablakban tetszőleges változó hisztogramját megkaphatjuk az adott klaszterben. Ha például a végeredmény két klaszterét, a 7. és 9. számút kiválasztjuk, akkor a jövedelemre az alábbi hisztogramokat kapjuk: 8.2. ábra. A klaszterek elemzése Látható, hogy a 7. klaszterben csak a legmagasabb jövedelem fordul elő, míg a 9. számúban az ez alatti két jövedelemosztály (azaz ezek voltak a definíciós tulajdonságok). Ugyanakkor ez természetesen a többi változó megoszlására is kihat, így például ha két, egymástól távolabbi klasztert hasonlítunk, ahogy a következő ábrán az alacsonyabb jövedelműekből álló 18-ast és az előzőekben már látott 9-est, akkor a nemek megoszlása között is jelentős különbségeket találunk:
5 ábra. A klaszterek elemzése Mig a 18-asban több a nő, addig a 9-es inkább férfiakból áll. Az ábra táblázatszerű felső része nemcsak a változók kiválasztására szolgál, hanem az összes nominális változó móduszát, illetve a numerikus változók átlagát is mutatja. Ha a következő fülre kattintunk, akkor megkapjuk az egyes klaszterek precíz definícióját az alábbiak szerint:
6 táblázat. A klaszterek adatai Alapértelmezésben minden változó szerepel, azok is, amelyek valójában nem játszanak szerepet a definícióban (pl. AFFINITY_CARD, ennek csak 0 és 1 lehet az értéke). Áttekinthetőbb képet kapunk, ha csak a legfontosabb szempontokat listáztatjuk. Ezt a lehetőséget a show attributes with minimum relevant rank fület bejelölve és a kívánt attribútum-számot megjelölve tudjuk aktiválni. Az eredményt a következő ábra mutatja. Leolvasható a 3 legfontosabb definíciós attribútum, a megbízhatóság közel 81% és 68 eset tartozik ebbe a klaszterbe.
7 táblázat. A klaszterek lényeges adatai A kapott klaszterezési eljárást alkalmazhatjuk is más, az elemzettel megegyező formátumú adatbázisra is. Ehhez a modellépítés helyett az Apply fülre kell kattintani. Első lépésként be kell állítani a már elkészült modellt, amelyet a program felkínál a már létező klaszterezések felsorolásával. Az adattáblát is kiválaszthatjuk a felkínált listából. Ezután meg kell adni az eseteket egyértelműen azonosító oszlop nevét (szokás szerint a CUST_ID) és végül az eredmény formátumát. Alapértelmezésben a legvalószínűbb klaszter szerepel a végeredményben. Itt nincs advanced settings fül, így már csak el kell indítani a futást. Az eredmény minden egyes esethez a legvalószínűbb klaszter száma mellett a valószínűséget is tartalmazza. Ez most a legtöbb esetben 1, vagy ahhoz igen közeli, de néhány olyan megfigyelés is található a file-ban, ahol valamely attribútum értéke nem szerepel a modell építésnél felhasznált adatbázisban ekkor jóval kisebb valószínűségű az adott klaszterhez tartozás.
8 táblázat. A klaszterezés eredménye Ugyanezeket az adatokat a részletesebb output-táblázattal is megmutatjuk. Ehhez az összes klasztert be kellett jelölni az Apply Option ablakban a Specific Klaszter Ids pontban. Látható például, hogy a bizonytalanul a 15. számú klaszterhez rendelt sorszámú megfigyelés nem sokkal kisebb eséllyel a 19., vagy a 18. számú klaszterhez is tartozhat.
9 8.7. táblázat. A klaszterezés részletes eredménye 9
Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók
Matematikai alapok és valószínőségszámítás Középértékek és szóródási mutatók Középértékek A leíró statisztikák talán leggyakrabban használt csoportját a középértékek jelentik. Legkönnyebben mint az adathalmaz
Részletesebben4. LECKE: DÖNTÉSI FÁK - OSZTÁLYOZÁS II. -- Előadás. 4.1. Döntési fák [Concepts Chapter 11]
1 4. LECKE: DÖNTÉSI FÁK - OSZTÁLYOZÁS II. -- Előadás 4.1. Döntési fák [Concepts Chapter 11] A döntési fákon alapuló klasszifikációs eljárás nagy előnye, hogy az alkalmazása révén nemcsak egyedenkénti előrejelzést
RészletesebbenSTATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése
4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól
RészletesebbenGépi tanulás a gyakorlatban. Bevezetés
Gépi tanulás a gyakorlatban Bevezetés Motiváció Nagyon gyakran találkozunk gépi tanuló alkalmazásokkal Spam detekció Karakter felismerés Fotó címkézés Szociális háló elemzés Piaci szegmentáció analízis
RészletesebbenELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június
GAZDASÁGSTATISZTIKA GAZDASÁGSTATISZTIKA Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TátK Közgazdaságtudományi Tanszékén az ELTE Közgazdaságtudományi
RészletesebbenRegresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.
Regresszió Csorba János Nagyméretű adathalmazok kezelése 2010. március 31. A feladat X magyarázó attribútumok halmaza Y magyarázandó attribútumok) Kérdés: f : X -> Y a kapcsolat pár tanítópontban ismert
RészletesebbenGrafikonok automatikus elemzése
Grafikonok automatikus elemzése MIT BSc önálló laboratórium konzulens: Orosz György 2016.05.18. A feladat elsődleges célkitűzései o eszközök adatlapján található grafikonok feldolgozása, digitalizálása
RészletesebbenFEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen
RészletesebbenMintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás
STATISZTIKA, BIOMETRIA. Előadás Mintavétel, mintavételi technikák, adatbázis Mintavétel fogalmai A mintavételt meg kell tervezni A sokaság elemei: X, X X N, lehet véges és végtelen Mintaelemek: x, x x
RészletesebbenStatisztika I. 8. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 8. előadás Előadó: Dr. Ertsey Imre Minták alapján történő értékelések A statisztika foglalkozik. a tömegjelenségek vizsgálatával Bizonyos esetekben lehetetlen illetve célszerűtlen a teljes
RészletesebbenKutatásmódszertan és prezentációkészítés
Kutatásmódszertan és prezentációkészítés 10. rész: Az adatelemzés alapjai Szerző: Kmetty Zoltán Lektor: Fokasz Nikosz Tizedik rész Az adatelemzés alapjai Tartalomjegyzék Bevezetés Leíró statisztikák I
RészletesebbenFEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 10 X. SZIMULÁCIÓ 1. VÉLETLEN számok A véletlen számok fontos szerepet játszanak a véletlen helyzetek generálásában (pénzérme, dobókocka,
RészletesebbenSzámítógépes képelemzés 7. előadás. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék
Számítógépes képelemzés 7. előadás Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék Momentumok Momentum-alapú jellemzők Tömegközéppont Irányultáság 1 2 tan 2 1 2,0 1,1 0, 2 Befoglaló
RészletesebbenAdatelemzés és adatbányászat MSc
Adatelemzés és adatbányászat MSc 12. téma Klaszterezési módszerek Klaszterezés célja Adott az objektumok, tulajdonságaik együttese. Az objektumok között hasonlóságot és különbözőséget fedezhetünk fel.
RészletesebbenAdatintegritás ellenőrzés Felhasználói dokumentáció verzió 2.0 Budapest, 2008.
Adatintegritás ellenőrzés Felhasználói dokumentáció verzió 2.0 Budapest, 2008. Változáskezelés Verzió Dátum Változás Pont Cím Oldal Kiadás: 2008.10.30. Verzió: 2.0. Oldalszám: 2 / 11 Tartalomjegyzék 1.
RészletesebbenAz értékelés során következtetést fogalmazhatunk meg a
Az értékelés során következtetést fogalmazhatunk meg a a tanuló teljesítményére, a tanulási folyamatra, a célokra és követelményekre a szülők teljesítményére, a tanulási folyamatra, a célokra és követelményekre
Részletesebben2. Adott a valós számok halmazán értelmezett f ( x) 3. Oldja meg a [ π; π] zárt intervallumon a. A \ B = { } 2 pont. függvény.
1. Az A halmaz elemei a ( 5)-nél nagyobb, de 2-nél kisebb egész számok. B a pozitív egész számok halmaza. Elemeinek felsorolásával adja meg az A \ B halmazt! A \ B = { } 2. Adott a valós számok halmazán
RészletesebbenKonjugált gradiens módszer
Közelítő és szimbolikus számítások 12. gyakorlat Konjugált gradiens módszer Készítette: Gelle Kitti Csendes Tibor Vinkó Tamás Faragó István Horváth Róbert jegyzetei alapján 1 LINEÁRIS EGYENLETRENDSZEREK
RészletesebbenKeresés képi jellemzők alapján. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék
Keresés képi jellemzők alapján Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék Lusta gépi tanulási algoritmusok Osztályozás: k=1: piros k=5: kék k-legközelebbi szomszéd (k=1,3,5,7)
RészletesebbenSegítség az outputok értelmezéséhez
Tanulni: 10.1-10.3, 10.5, 11.10. Hf: A honlapra feltett falco_exp.zip-ben lévő exploratív elemzések áttanulmányozása, érdekességek, észrevételek kigyűjtése. Segítség az outputok értelmezéséhez Leiro: Leíró
RészletesebbenBevezetés a QGIS program használatába Összeálította dr. Siki Zoltán
Bevezetés Bevezetés a QGIS program használatába Összeálította dr. Siki Zoltán A QGIS program egy nyiltforrású asztali térinformatikai program, mely a http://www.qgis.org oldalról tölthető le. Ebben a kis
RészletesebbenEgyszerű programozási tételek
Egyszerű programozási tételek 2. előadás Sergyán Szabolcs sergyan.szabolcs@nik.uni-obuda.hu Óbudai Egyetem Neumann János Informatikai Kar 2011. szeptember 15. Sergyán (OE NIK) AAO 02 2011. szeptember 15.
RészletesebbenAdatbányászat: Klaszterezés Haladó fogalmak és algoritmusok
Adatbányászat: Klaszterezés Haladó fogalmak és algoritmusok 9. fejezet Tan, Steinbach, Kumar Bevezetés az adatbányászatba előadás-fóliák fordította Ispány Márton Logók és támogatás A tananyag a TÁMOP-4.1.2-08/1/A-2009-0046
RészletesebbenMérlegelés több cég számára
METRISoft Mérleggyártó KFT PortaWin (PW2) Jármű mérlegelő program 6800 Hódmezővásárhely Jókai u. 30 Telefon: (62) 246-657, Fax: (62) 249-765 e-mail: merleg@metrisoft.hu Web: http://www.metrisoft.hu Módosítva:
Részletesebben1.1.1 Dátum és idő függvények
1.1.1 Dátum és idő függvények Azt már tudjuk, hogy két dátum különbsége az eltelt napok számát adja meg, köszönhetően a dátum tárolási módjának az Excel-ben. Azt is tudjuk a korábbiakból, hogy a MA() függvény
RészletesebbenTérképek jelentése és elemzése
Térképek jelentése és elemzése Ontológiák Az ontológiák termekre, csomópontokra (koncepciókra) és összeköttetésekre (kapcsolatokra) vonatkozó listák, amik importálhatóak és hozzáadhatóak a VUE térképekhez,
RészletesebbenStatisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában
Statisztikai alapok Leíró statisztika Lineáris módszerek a statisztikában Tudományosan és statisztikailag tesztelhető állítások? A keserűcsokoládé finomabb, mint a tejcsoki. A patkány a legrondább állat,
RészletesebbenALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN!
A1 A2 A3 (8) A4 (12) A (40) B1 B2 B3 (15) B4 (11) B5 (14) Bónusz (100+10) Jegy NÉV (nyomtatott nagybetűvel) CSOPORT: ALÁÍRÁS: ALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN! 2011. december 29. Általános tudnivalók:
RészletesebbenKözösség detektálás gráfokban
Közösség detektálás gráfokban Önszervező rendszerek Hegedűs István Célkitűzés: valamilyen objektumok halmaza felett minták, csoportok detektálása csakis az egyedek közötti kapcsolatok struktúrájának a
RészletesebbenMiskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Klaszteranalízis Hasonló dolgok csoportosítását jelenti, gyakorlatilag az osztályozás szinonimájaként értelmezhetjük. A klaszteranalízis célja A klaszteranalízis alapvető célja, hogy a megfigyelési egységeket
Részletesebben26. MINIMÁLIS KÖLTSÉGŰ UTAK MINDEN CSÚCSPÁRRA
26. MINIMÁLIS KÖLTSÉGŰ UTAK MINDEN CSÚCSPÁRRA Az előző két fejezetben tárgyalt feladat általánosításaként a gráfban található összes csúcspárra szeretnénk meghatározni a legkisebb költségű utat. A probléma
Részletesebbenc adatpontok és az ismeretlen pont közötti kovariancia vektora
1. MELLÉKLET: Alkalmazott jelölések A mintaterület kiterjedése, területe c adatpontok és az ismeretlen pont közötti kovariancia vektora C(0) reziduális komponens varianciája C R (h) C R Cov{} d( u, X )
RészletesebbenA leíró statisztikák
A leíró statisztikák A leíró statisztikák fogalma, haszna Gyakori igény az, hogy egy adathalmazt elemei egyenkénti felsorolása helyett néhány jellemző tulajdonságának megadásával jellemezzünk. Ezeket az
RészletesebbenFEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,
RészletesebbenA LEGKÖZELEBBI SZOMSZÉD ANALÍZISHEZ SZÜKSÉGES TERÜLETI ADATBÁZISOK KIALAKÍTÁSÁNAK MÓDSZERTANI KÉRDÉSEI
A LEGKÖZELEBBI SZOMSZÉD ANALÍZISHEZ SZÜKSÉGES TERÜLETI ADATBÁZISOK KIALAKÍTÁSÁNAK MÓDSZERTANI KÉRDÉSEI Pfening Viola ELTE TTK Regionális Tudományi Tanszék Társadalom és térinformatika Innovatív módszerek
Részletesebbeny ij = µ + α i + e ij
Elmélet STATISZTIKA 3. Előadás Variancia-analízis Lineáris modellek A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek okai
RészletesebbenÚj típusú döntési fa építés és annak alkalmazása többtényezős döntés területén
Új típusú döntési fa építés és annak alkalmazása többtényezős döntés területén Dombi József Szegedi Tudományegyetem Bevezetés - ID3 (Iterative Dichotomiser 3) Az ID algoritmusok egy elemhalmaz felhasználásával
Részletesebben11. Előadás. 11. előadás Bevezetés a lineáris programozásba
11. Előadás Gondolkodnivalók Sajátérték, Kvadratikus alak 1. Gondolkodnivaló Adjuk meg, hogy az alábbi A mátrixnak mely α értékekre lesz sajátértéke a 5. Ezen α-ák esetén határozzuk meg a 5 sajátértékhez
Részletesebben5. LECKE: TÁMASZVEKTOROK (SVM, Support Vector Machines)
5. LECKE: TÁMASZVEKTOROK (SVM, Support Vector Machines) -- Előadás 5.1. Támaszvektor osztályozásra [C18] Ez a témakör a klasszifikációhoz áll legközelebb, bár alkalmazható más területeken is (regresszió,
RészletesebbenA d m i n i s z t r á c i ó s f e l a d a t o k a I n t e g r á l t K ö n y v t á r i R e n d s z e r b e n
A d m i n i s z t r á c i ó s f e l a d a t o k a I n t e g r á l t K ö n y v t á r i R e n d s z e r b e n JavaADM Kézikönyv Tartalomjegyzék 1 PROGRAMLEÍRÁS... 3 1.1 A PROGRAM ÁLTALÁNOS HASZNÁLATA...
RészletesebbenA TeamViewer 9 Szerviz-Trade Host telepítése
A TeamViewer 9 Szerviz-Trade Host telepítése A Szerviz-Trade Kft. a TeamViewer 9 verzióig tud távsegítséget nyújtani. A már telepített magasabb verziójú TeamViewer-t, a 9-es verzió telepítése előtt el
RészletesebbenHASZNÁLATI ÚTMUTATÓ DOLGOZÓK IMPORTÁLÁSA KULCS BÉR PROGRAMBA AZ ONLINE MUNKAIDŐ NYILVÁNTARTÓ RENDSZERBŐL. Budapest, 2013. november 08.
HASZNÁLATI ÚTMUTATÓ DOLGOZÓK IMPORTÁLÁSA KULCS BÉR PROGRAMBA AZ ONLINE MUNKAIDŐ NYILVÁNTARTÓ RENDSZERBŐL Budapest, 2013. november 08. 1. CÉLKITŰZÉS A fő cél, hogy az OL Munkaidő Rendszerből kinyert jelenlét
RészletesebbenGyakorló feladatok adatbányászati technikák tantárgyhoz
Gyakorló feladatok adatbányászati technikák tantárgyhoz Buza Krisztián Számítástudományi és Információelméleti Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem Klaszterezés kiértékelése Feladat:
Részletesebben3. Ezután a jobb oldali képernyő részen megjelenik az adatbázistábla, melynek először a rövid nevét adjuk meg, pl.: demo_tabla
1. Az adatbázistábla létrehozása a, Ha még nem hoztunk létre egy adatbázistáblát sem, akkor a jobb egérrel a DDIC-objekt. könyvtárra kattintva, majd a Létrehozás és az Adatbázistábla menüpontokat választva
RészletesebbenPortaWin (PW2) Jármű mérlegelő program Mérlegelés több cég számára
METRISoft Mérleggyártó KFT PortaWin (PW2) Jármű mérlegelő program 6800 Hódmezővásárhely Jókai u. 30 Telefon: (62) 246-657, Fax: (62) 249-765 e-mail: merleg@metrisoft.hu Web: http://www.metrisoft.hu Módosítva:
RészletesebbenA mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015
A mérés problémája a pedagógiában Dr. Nyéki Lajos 2015 A mérés fogalma Mérésen olyan tevékenységet értünk, amelynek eredményeként a vizsgált jelenség számszerűen jellemezhetővé, más hasonló jelenségekkel
RészletesebbenCAD-CAM-CAE Példatár
CAD-CAM-CAE Példatár A példa megnevezése: A példa száma: A példa szintje: CAx rendszer: Kapcsolódó TÁMOP tananyag rész: A feladat rövid leírása: VEM befogott tartó ÓE-A15 alap közepes haladó CATIA V5 CAD,
RészletesebbenÜgyfélforgalom számlálás modul
Ügyfélforgalom számlálás modul 1 1. Bevezetés... 3 2. BEÁLLÍTÁSOK... 4 2.1. Új Kérdőív létrehozása... 4 o Kérdéstípusok és a hozzájuk tartozó lehetséges válaszok hozzárendelése... 4 Új Kérdéstípus felvitele...
RészletesebbenVéletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.
Valószín ségelméleti és matematikai statisztikai alapfogalmak összefoglalása (Kemény Sándor - Deák András: Mérések tervezése és eredményeik értékelése, kivonat) Véletlen jelenség: okok rendszere hozza
RészletesebbenVALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA
VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA A VALÓSZÍNŰSÉGI SZEMLÉLET ALAPOZÁSA 1-6. OSZTÁLY A biztos, a lehetetlen és a lehet, de nem biztos események megkülünböztetése Valószínűségi játékok, kísérletek események
RészletesebbenMATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK EMELT SZINT Koordinátageometria
1) MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK EMELT SZINT Koordinátageometria A szürkített hátterű feladatrészek nem tartoznak az érintett témakörhöz, azonban szolgálhatnak fontos információval az érintett feladatrészek
RészletesebbenNAV-ban. 1 Az import áfa könyveléséhez szükséges beállítások
Import áfa kezelése Microsoft Dynamics NAV-ban Ha külföldről szerzünk be egy eszközt, akkor a szokásos könyvelési feladatainkon kívül a vámterhek és az import áfa könyvelését kell megtennünk. Tehát miután
RészletesebbenHallgatói segédlet a tananyag megjelenítéséhez
Hallgatói segédlet a tananyag megjelenítéséhez A Hunline rendszerbe a hunline.hu oldalon lehet belépni. Felhasználói névként a Neptun kódot, jelszóként a születési adatok nyolc számjegyét kell megadni.
RészletesebbenPontműveletek. Sergyán Szabolcs Óbudai Egyetem Neumann János Informatikai Kar február 20.
Pontműveletek Sergyán Szabolcs sergyan.szabolcs@nik.uni-obuda.hu Óbudai Egyetem Neumann János Informatikai Kar 2012. február 20. Sergyán (OE NIK) Pontműveletek 2012. február 20. 1 / 40 Felhasznált irodalom
RészletesebbenNagyméretű adathalmazok kezelése (BMEVISZM144) Reinhardt Gábor április 5.
Asszociációs szabályok Budapesti Műszaki- és Gazdaságtudományi Egyetem 2012. április 5. Tartalom 1 2 3 4 5 6 7 ismétlés A feladat Gyakran együtt vásárolt termékek meghatározása Tanultunk rá hatékony algoritmusokat
Részletesebbeny ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell
Példa STATISZTIKA Egy gazdálkodó k kukorica hibrid termesztése között választhat. Jelöljük a fajtákat A, B, C, D-vel. Döntsük el, hogy a hibridek termesztése esetén azonos terméseredményre számíthatunk-e.
RészletesebbenNemzeti Társadalmi Felzárkóztatási Stratégia indikátor rendszer
Szociális ÁIR (Szociális Ágazati Információs Rendszer) Nemzeti Társadalmi Felzárkóztatási Stratégia indikátor rendszer Felhasználói útmutató Budapest, 2012. december 1 Tartalomjegyzék 1. Előzmények, célok...
RészletesebbenSzámelmélet Megoldások
Számelmélet Megoldások 1) Egy számtani sorozat második tagja 17, harmadik tagja 1. a) Mekkora az első 150 tag összege? (5 pont) Kiszámoltuk ebben a sorozatban az első 111 tag összegét: 5 863. b) Igaz-e,
RészletesebbenStruktúra nélküli adatszerkezetek
Struktúra nélküli adatszerkezetek Homogén adatszerkezetek (minden adatelem azonos típusú) osztályozása Struktúra nélküli (Nincs kapcsolat az adatelemek között.) Halmaz Multihalmaz Asszociatív 20:24 1 A
RészletesebbenESZR - Feltáró hálózat
ESZR - Feltáró hálózat ERDŐGAZDÁLKODÁS/FELTÁRÓ HÁLÓZAT Bevezetés Az erdészeti tevékenységeket támogató technológiák folyamatos fejlődésével szükségessé válik az erdőfeltárás, az erdőfeltáró hálózatok -
RészletesebbenA PiFast program használata. Nagy Lajos
A PiFast program használata Nagy Lajos Tartalomjegyzék 1. Bevezetés 3 2. Bináris kimenet létrehozása. 3 2.1. Beépített konstans esete.............................. 3 2.2. Felhasználói konstans esete............................
RészletesebbenAz alábbiakban a portál felépítéséről, illetve az egyes lekérdező funkciókról kaphat részletes információkat.
Súgó Az alábbiakban a portál felépítéséről, illetve az egyes lekérdező funkciókról kaphat részletes információkat. A lekérdező rendszer a Hírközlési Szolgáltatások és Interfész bejelentések, valamint az
RészletesebbenBabeş Bolyai Tudományegyetem, Kolozsvár Matematika és Informatika Kar Magyar Matematika és Informatika Intézet
/ Babeş Bolyai Tudományegyetem, Kolozsvár Matematika és Informatika Kar Magyar Matematika és Informatika Intézet / Tartalom 3/ kernelek segítségével Felügyelt és félig-felügyelt tanulás felügyelt: D =
RészletesebbenEnsemble előrejelzések: elméleti és gyakorlati háttér HÁGEL Edit Országos Meteorológiai Szolgálat Numerikus Modellező és Éghajlat-dinamikai Osztály 34
Ensemble előrejelzések: elméleti és gyakorlati háttér HÁGEL Edit Országos Meteorológiai Szolgálat Numerikus Modellező és Éghajlat-dinamikai Osztály 34. Meteorológiai Tudományos Napok Az előadás vázlata
RészletesebbenBontott órák beállítása Példánkban egy évfolyambontott kapcsolatot hozunk létre úgy, hogy abban vannak csak osztálybontott csoportok is.
Bontott órák beállítása Példánkban egy évfolyambontott kapcsolatot hozunk létre úgy, hogy abban vannak csak osztálybontott csoportok is. Példa eset leírása Példa iskolánkban az elsősök esetében négy osztályba
RészletesebbenGépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés
Gépi tanulás a gyakorlatban Kiértékelés és Klaszterezés Hogyan alkalmazzuk sikeresen a gépi tanuló módszereket? Hogyan válasszuk az algoritmusokat? Hogyan hangoljuk a paramétereiket? Precízebben: Tegyük
RészletesebbenStatisztika I. 10. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 10. előadás Előadó: Dr. Ertsey Imre Varianciaanalízis A különböző tényezők okozta szórás illetőleg szórásnégyzet összetevőire bontásán alapszik Segítségével egyszerre több mintát hasonlíthatunk
RészletesebbenKoordinátageometria. , azaz ( ) a B halmazt pontosan azok a pontok alkotják, amelynek koordinátáira:
005-0XX Emelt szint Koordinátageometria 1) a) Egy derékszögű háromszög egyik oldalegyenese valamelyik koordinátatengely, egy másik oldalegyenesének egyenlete x + y = 10, egyik csúcsa az origó. Hány ilyen
RészletesebbenI. rész. Feladatsor. 2. Andi keresett két olyan számot, amelyre teljesül, hogy a < b. Igaz-e, hogy a < b?
1. Feladatsor I. rész 1. Adott két halmaz. A a 9-nél kisebb páros pozitív egészek; B a 30-nál kisebb, 6-tal osztható pozitív egészek halmaza. Adja meg az A B és a B \ A halmazokat!. Andi keresett két olyan
RészletesebbenMatematikai geodéziai számítások 6.
Matematikai geodéziai számítások 6. Lineáris regresszió számítás elektronikus távmérőkre Dr. Bácsatyai, László Matematikai geodéziai számítások 6.: Lineáris regresszió számítás elektronikus távmérőkre
RészletesebbenAz egyenes egyenlete: 2 pont. Az összevont alak: 1 pont. Melyik ábrán látható e függvény grafikonjának egy részlete?
1. Írja fel annak az egyenesnek az egyenletét, amely áthalad az (1; 3) ponton, és egyik normálvektora a (8; 1) vektor! Az egyenes egyenlete: 2. Végezze el a következő műveleteket, és vonja össze az egynemű
RészletesebbenPopulációbecslések és monitoring
Populációbecslések és monitoring A becslés szerepe az ökológiában és a vadgazdálkodásban. A becslési módszerek csoportosítása. Teljes számlálás. Statisztikai alapfogalmak. Fontos lehet tudnunk, hogy hány
RészletesebbenPC Connect. Unique ewsletter. program leírás
PC Connect Unique ewsletter program leírás Tartalomjegyzék Bevezető...- 1 - Előkészületek...- 2 - Alap adatok, alap fájlok...- 2 - A program használata...- 3 - E-mail files...- 3 - Swich text...- 4 - Settings...-
RészletesebbenOrvosi szociológia (1. szeminárium) KUTATÁSMÓDSZERTAN
Orvosi szociológia (1. szeminárium) KUTATÁSMÓDSZERTAN (Babbie) 1. Konceptualizáció 2. Operacionalizálás 3. Mérés 4. Adatfeldolgozás 5. Elemzés 6. Felhasználás KUTATÁS LÉPÉSEI 1. Konceptualizáció 2. Operacionalizálás
RészletesebbenMISKOLCI EGYETEM GÉPÉSZMÉRNÖKI ÉS INFORMATIKAI KAR
MISKOLCI EGYETEM GÉPÉSZMÉRNÖKI ÉS INFORMATIKAI KAR Korszerű információs technológiák Klaszteranalízis Tompa Tamás tanársegéd Általános Informatikai Intézeti Tanszék Miskolc, 2018. október 20. Tartalom
RészletesebbenDKÜ ZRT. A Portál rendszer felületének általános bemutatása. Felhasználói útmutató. Támogatott böngészők. Felületek felépítése. Információs kártyák
A Portál rendszer felületének általános bemutatása Felhasználói útmutató Támogatott böngészők Internet Explorer 9+ Firefox (legújabb verzió) Chrome (legújabb verzió) Felületek felépítése Információs kártyák
RészletesebbenAdatok statisztikai értékelésének főbb lehetőségei
Adatok statisztikai értékelésének főbb lehetőségei 1. a. Egy- vagy kétváltozós eset b. Többváltozós eset 2. a. Becslési problémák, hipotézis vizsgálat b. Mintázatelemzés 3. Szint: a. Egyedi b. Populáció
RészletesebbenRegresszió számítás. Tartalomjegyzék: GeoEasy V2.05+ Geodéziai Kommunikációs Program
Regresszió számítás GeoEasy V2.05+ Geodéziai Kommunikációs Program DigiKom Kft. 2006-2010 Tartalomjegyzék: Egyenes x változik Egyenes y változik Egyenes y és x változik Kör Sík z változik Sík y, x és z
RészletesebbenGépi tanulás a gyakorlatban. Lineáris regresszió
Gépi tanulás a gyakorlatban Lineáris regresszió Lineáris Regresszió Legyen adott egy tanuló adatbázis: Rendelkezésünkre áll egy olyan előfeldolgozott adathalmaz, aminek sorai az egyes ingatlanokat írják
RészletesebbenAz éghajlati modellek eredményeinek alkalmazhatósága hatásvizsgálatokban
Az éghajlati modellek eredményeinek alkalmazhatósága hatásvizsgálatokban Szépszó Gabriella Országos Meteorológiai Szolgálat, szepszo.g@met.hu RCMTéR hatásvizsgálói konzultációs workshop 2015. június 23.
RészletesebbenMódszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!
BGF KKK Módszertani Intézeti Tanszéki Osztály Budapest, 2012.. Név:... Neptun kód:... Érdemjegy:..... STATISZTIKA II. VIZSGADOLGOZAT Feladatok 1. 2. 3. 4. 5. 6. Összesen Szerezhető pontszám 21 20 7 22
RészletesebbenBérprogram és az abevjava kapcsolata
Bérprogram és az abevjava kapcsolata Ahhoz, hogy a bérprogram és az abevjava program együtt tudjon működni, szükséges a két program egymásra hangolása. Az abevjava program telepítését követően nézzük meg,
RészletesebbenMatematikai geodéziai számítások 6.
Nyugat-magyarországi Egyetem Geoinformatikai Kara Dr. Bácsatyai László Matematikai geodéziai számítások 6. MGS6 modul Lineáris regresszió számítás elektronikus távmérőkre SZÉKESFEHÉRVÁR 2010 Jelen szellemi
RészletesebbenBiomatematika 2 Orvosi biometria
Biomatematika 2 Orvosi biometria 2017.02.05. Orvosi biometria (orvosi biostatisztika) Statisztika: tömegjelenségeket számadatokkal leíró tudomány. A statisztika elkészítésének menete: tanulmányok (kísérletek)
RészletesebbenVéletlenszám generátorok és tesztelésük HORVÁTH BÁLINT
Véletlenszám generátorok és tesztelésük HORVÁTH BÁLINT Mi a véletlen? Determinisztikus vs. Véletlen esemény? Véletlenszám: számok sorozata, ahol véletlenszerűen követik egymást az elemek Pszeudo-véletlenszám
RészletesebbenFELHASZNÁLÓI ÚTMUTATÓ
FELHASZNÁLÓI ÚTMUTATÓ 0.1v. GYŰJTŐI TÉGLÁK LISTÁZÁSA A listázó elérése menüből: Téglák/Gyűjtői téglák Mielőtt lekérnénk egy listát, lehetőség van bizonyos szűrési feltételek megadására a Listázás keretrészen
RészletesebbenTáblázatok. Táblázatok beszúrása. Cellák kijelölése
Táblázatok Táblázatok beszúrása A táblázatok sorokba és oszlopokba rendezett téglalap alakú cellákból épülnek fel. A cellák tartalmazhatnak képet vagy szöveget. A táblázatok használhatók adatok megjelenítésére,
RészletesebbenFITNESS SYSTEM Telepítési útmutató
FITNESS SYSTEM Telepítési útmutató web: www.szakk.hu e-mail: info@szakk.hu Tartalomjegyzék: Első lépések:... 3 Licenc megállapodás... 3 Telepítési kulcs... 4 Felhasználói adatok... 5 Telepítő csomagok
Részletesebben1. tétel. Valószínűségszámítás vizsga Frissült: 2013. január 19. Valószínűségi mező, véletlen tömegjelenség.
1. tétel Valószínűségszámítás vizsga Frissült: 2013. január 19. Valószínűségi mező, véletlen tömegjelenség. A valószínűségszámítás tárgya: véletlen tömegjelenségek vizsgálata. véletlen: a kísérlet kimenetelét
RészletesebbenStatisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1.
Statisztika I. 4. előadás Mintavétel http://uni-obuda.hu/users/koczyl/statisztika1.htm Kóczy Á. László KGK-VMI koczy.laszlo@kgk.uni-obuda.hu Sokaság és minta Alap- és mintasokaság A mintasokaság az a részsokaság,
RészletesebbenA tanulók gyűjtsenek saját tapasztalatot az adott szenzorral mérhető tartomány határairól.
A távolságszenzorral kapcsolatos kísérlet, megfigyelés és mérések célkitűzése: A diákok ismerjék meg az ultrahangos távolságérzékelő használatát. Szerezzenek jártasságot a kezelőszoftver használatában,
RészletesebbenMÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI
MÉRÉSI EREDMÉYEK POTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI. A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk
RészletesebbenTantárgyfelosztás. I. Ellenőrzés. Mielőtt hozzákezd a tantárgyfelosztás tervezéséhez, ellenőrizze le, illetve állítsa be a következőket:
Tantárgyfelosztás I. Ellenőrzés Mielőtt hozzákezd a tantárgyfelosztás tervezéséhez, ellenőrizze le, illetve állítsa be a következőket: Alkalmazott képes menü > alkalmazottak alapadatai - Alkalmazottak
RészletesebbenIktatás modul. Kezelői leírás
Iktatás modul Kezelői leírás 1 C.) Iktatás modul A modul kezelése történhet a menürendszerből, illetve az Iktatás modul fülén lévő ikonok segítségével. Az Iktatás modul önállóan vagy más modulok törzsadatait
RészletesebbenA regisztrált álláskeresők számára vonatkozó becslések előrejelző képességének vizsgálata
A regisztrált álláskeresők számára vonatkozó becslések előrejelző képességének vizsgálata Az elemzésben a GoogleTrends (GT, korábban Google Insights for Search) modellek mintán kívüli illeszkedésének vizsgálatával
Részletesebben1. MATEMATIKA EMELT SZINTŰ ÍRÁSBELI FELADATSOR
1. MATEMATIKA EMELT SZINTŰ ÍRÁSBELI FELADATSOR A feladatok megoldására 240 perc fordítható, az idő leteltével a munkát be kell fejeznie. A feladatok megoldási sorrendje tetszőleges. A II. részben kitűzött
RészletesebbenHírlevél 2007. április Fejlesztések és változások a Precíz Integrált Ügyviteli Információs rendszerben 2007. II. negyedév Tartalomjegyzék Készlet modul... 3 Aktuális elszámoló ár Számlázás modul... 4 Partnerek
RészletesebbenExact inference in general Bayesian networks
Exact inference in general Bayesian networks Peter Antal antal@mit.bme.hu Overview The Probability Propagation in Trees of Cliques (a.k.a. ~in join trees) Practical inference Exercises Literature: Valószínűségi
RészletesebbenMinta 2. MATEMATIKA KÖZÉPSZINTŰ ÍRÁSBELI FELADATSOR. I. rész
2. MATEMATIKA KÖZÉPSZINTŰ ÍRÁSBELI FELADATSOR I. rész A feladatok megoldására 45 perc fordítható, az idő leteltével a munkát be kell fejeznie. A feladatok megoldási sorrendje tetszőleges. A feladatok megoldásához
RészletesebbenVisualBaker Telepítési útmutató
VisualBaker Telepítési útmutató Office Hungary Bt web: www.visualbaker.hu e-mail: info@visualbaker.hu Tartalomjegyzék: Telepítési útmutató... 1 Tartalomjegyzék:... 2 Első lépések:... 3 Telepítési kulcs...
Részletesebben