Gépi tanulás a Rapidminer programmal. Stubendek Attila



Hasonló dokumentumok
Adatbányászat Weka-val. (Data Mining with Weka Ian H. Witten)

E x μ x μ K I. és 1. osztály. pontokként), valamint a bayesi döntést megvalósító szeparáló görbét (kék egyenes)

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

Munka a fájlokkal. Az általánosan használt fájltípusok. Programfájlok. Adatfájlok

Easton420. Automata Telefon hangrögzítő. V 6.0 Telepítése Windows XP rendszerre

Digitális technika (VIMIAA02) Laboratórium 1

Kérem, ismerkedjen meg a DigitAudit program AuditTeszt moduljának Adatok tesztelése menüpontjával.

Digitális technika (VIMIAA02) Laboratórium 1

MARKETING ELEMZÉS TERVEZÉS PROGRAM ISMERTETİ

Algoritmizálás és adatmodellezés tanítása beadandó feladat: Algtan1 tanári beadandó /99 1

INFORMATIKAI ALAPISMERETEK

Esri Arcpad Utó- feldolgozás. Oktatási anyag - utókorrekció

INFORMATIKAI ALAPISMERETEK

Országos Területrendezési Terv térképi mel ékleteinek WMS szolgáltatással történő elérése, MapInfo program alkalmazásával Útmutató 2010.

Rajz 06 gyakorló feladat

MEGÚJÍTOTT GIROLOCK_CA TANÚSÍTVÁNYCSERE

R-LINK 2 A szoftver használati útmutatója

Neurális hálózatok.... a gyakorlatban

Aromo Szöveges értékelés normál tantárggyal

Országos Területrendezési Terv térképi mellékleteinek WMS szolgáltatással történő elérése, MapInfo program alkalmazásával

Gépi tanulás a gyakorlatban. Lineáris regresszió

Intelligens Rendszerek Elmélete. Versengéses és önszervező tanulás neurális hálózatokban

Kézikönyv. Pro-forma számla nyomtatása

S z á m í t ó g é p e s a l a p i s m e r e t e k

Aromo Szöveges Értékelés

Aromo Szöveges értékelés kódolt tantárggyal

Digitális Technika. Dr. Oniga István Debreceni Egyetem, Informatikai Kar

QGIS gyakorló. --tulajdonságok--stílus fül--széthúzás a terjedelemre).

Digitális Technika. Dr. Oniga István Debreceni Egyetem, Informatikai Kar

RTCM alapú VITEL transzformáció felhasználó oldali beállítása Spectra Precision Survey Pro Recon szoftver használata esetén

QGIS GRASS beépülő modul és GRASS GIS 7.0 (beta1 verzió) Hidrológiai analízis segédlet

Zoiper VoIP mobil alkalmazás szoftver beállítása Android rendszerre

Változtatások végrehajtása a kijelző beállításaival

Algoritmizálás és adatmodellezés tanítása beadandó feladat: Algtan1 tanári beadandó /99 1

Guarding Vision Beállítása

Első lépések. File/New. A mentés helyét érdemes módosítani! Pl. Dokumentumok. Fájlnév: pl. Proba

Programozási alapismeretek beadandó feladat: ProgAlap beadandó feladatok téma 99. feladat 1

Adatbányászat beadandó projekt

Meglévő munkafüzet megnyitása, mentése új néven

Útmutató szivárgásvizsgálat-köteles berendezéseket érintő csoportos műveletekhez

Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs rendszerek Tanszék. Neurális hálók. Pataki Béla

Access gyakorlati feladatok lépésről lépésre

Változók. Mennyiség, érték (v. objektum) szimbolikus jelölése, jelentése Tulajdonságai (attribútumai):

SR mini PLC Modbus illesztő modul. Modul beállítása Bemeneti pontok kiosztása főmodul esetén Bemeneti pontok címkiosztása kiegészítő modul esetében

Apache OpenOffice telepítési útmutató

Új típusú döntési fa építés és annak alkalmazása többtényezős döntés területén

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés

Keresés képi jellemzők alapján. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Feladat. Bemenő adatok. Bemenő adatfájlok elvárt formája. Berezvai Dániel 1. beadandó/4. feladat április 13. Például (bemenet/pelda.

1. kép. A Stílus beállítása; új színskála megadása.

OpenOffice.org mint fejlesztési platform

Intelligens Rendszerek Gyakorlata. Neurális hálózatok I.

ReszlAd fájl, kitöltési útmutató:

"Eseményekre imm/connection Server scriptek futtatása

BASH script programozás II. Vezérlési szerkezetek

A MOKKA hitelesítő szoftver telepítése és használata

Bűnügyi adatok elemzése, QGIS Copiapó verzióra Wilpen L. Gorr oktatóanyaga alapján

é rtésí té sék szű ré sé

Rövid leírás a Make Your Mark szoftver használatához

CMS videó megjelenítő szoftver használata

3 A hálózati kamera beállítása LAN hálózaton keresztül

AKTUÁTOR MODELLEK KIVÁLASZTÁSA ÉS OBJEKTÍV ÖSSZEHASONLÍTÁSA

Teljesen elosztott adatbányászat pletyka algoritmusokkal. Jelasity Márk Ormándi Róbert, Hegedűs István

SZE INFORMATIKAI KÉPZÉS 1

Kézikönyv. A Vevők infosystem használata

1 of :54

Tanúsítvány igénylése sportegyesületek számára





























QGIS gyakorló. Cím: Pufferzóna előállítása (Buffering) Minta fájl letöltése:

Funkcionális Nyelvek 2 (MSc)

Archivált tanulmányi adatok importálása. Felhasználói dokumentáció verzió 2.0.

TARTALOMJEGYZÉK. TARTALOMJEGYZÉK...vii ELŐSZÓ... xiii BEVEZETÉS A lágy számításról A könyv célkitűzése és felépítése...

Diagram létrehozása. 1. ábra Minta a diagramkészítéshez

Átírás:

Gépi tanulás a Rapidminer programmal Stubendek Attila

Rapidminer letöltése Google: download rapidminer Rendszer kiválasztása (iskolai gépeken Other Systems java) Kicsomagolás lib/rapidminer.jar elindítása Helyi repository megjelölése egy tetszőleges mappában

Rapidminer

Példa megnyitása

RM bemutatása példával Operátorok: I/O Diszkretizáció Szabálytanuló Összeköttetések! Attribútumok oldalt: Futtassuk le a láncot!

Példalánc lefuttatása Lánc megadása (előző képernyő) Eredmény A modell kimenete A lánc állapota lefutás után A modell kimenete (RuleLearner)

Új lánc létrehozása Hozzunk létre egy új láncot! (New..) Bemeneti adat legyen egy belső példaadat (Iris) Clusterezzünk!

Új lánc (cluster) Repository Data Iris Állítsuk be az attribútumokat és futtassuk le!

Új lánc (cluster) Eredmény: Egyes adatelemek cluster-hovatartozásai A clusterek középpontjai Grafikus megjelenítés

Tanuló modulok bemutatása A mellékelt táblázatokkal próbáljuk ki a tanuló modulokat és azok képességeit! Táblázat beolvasása: Import / Data / Import XLS (vagy más esetben bármilyen más formátum) Célszerű használni az Import Configuration Wizardot: válasszuk ki a fájlt, a munkalapot, az adattartományt, majd állítsuk be az attribútum típusokat valósra (real), a labelt pedig felsorolásira, majd számra (modelltől függően) A beolvasó tulajdonságai közt first row as names pipa

Számok összege Példa: Egy adatpont hat valós (0 és 1 közti) attribútumból áll (att6real.xls). Osztályozzuk az összegük alapján: Ha több, mint három, akkor az 1- es osztályban van, ha nem, akkor a 0-ban. Ez a példa láthatóan gyerekjáték a neurális hálóknak, de gyakorlatilag megoldhatatlan a döntési fáknak.

OFF: jegyzőkönyv A labor teljesítésének feltétele elektronikus jegyzőkönyv leadása. Ennek pontos módja a diasor végén lesz ismertetve, ezért a következő feladatokat mentsük el külön, egymás után, hogy ne kelljen újra felépíteni a rendszereket!

Adat (exa = example set) Train set input Modell A tanítóadatot használjuk tesztelésre Adat beolvasása Számattribútumok diszkretizációja (ID3 nem kezeli a folytonos real tipust) (Data Transformation / Type conversation / Discretization / Discretize by Frequency) ID3 döntési fa modelltanuló (Modelling / Classification / Tree Induction / ID3) Mivel a modellt szeretnénk megjeleníteni, de ki is próbálni, ezért kétszerezzük (Process control / Multiply) Teljesítmény lemérése (Evalution / Performance Measurement / Performance) Modell alkalmazása egy adathalmazon (Modelling / Modell Aplication / Apply Model)

Eredmény A döntési fa igen tarka, de jó eredményt ad magára a tanulóhalmazra

Valódi teszt A tanulóhalmazon lehet tesztelni, de nem feltétlenül ad valós képet. Próbáljuk ki egy másik, ugyanolyan típusú adathalmazra! Mellékelve van egy másik táblázat, ugyanolyan típusú (att6real_test.xls). Olvassuk be, és a modellalkalmazónak azt adjuk be!

A Model Applyer bemenete egy másik táblázat Valódi teszt

Valódi teszt Mivel a döntési fa erre a feladatra nem optimális, ugyan rá tud tanulni egy konkrét adathalmazra, a szabályosságot nem tudja elsajátítani. Más adathalmazra már rossz eredményt ad.

Valódi teszt Cseréljük le a döntési fát perceptronra! Próbáljuk ki az eredményt 3-10-20-100 körre (a percetron round tulajdonsága)

Valódi teszt A teljesítmény nagyságrenddel jobb, még ha nem is tökéletes (6 dimenzióhoz képest kicsi a tanulóhalmaz). Nézzük meg a perceptron kimenetét is, milyen súlyokat adott a tanulás!

Másik példa Tanítsuk meg modelljeinket a kizáró vagy (XOR) függvényre (att2logic.xls és att2logic_test.xls)! Ahogy lehet sejteni, a perceptron nem tudja megoldani a feladatot, 50% körüli, azaz teljesen véletlen eredményt ad. A döntési fa és a szabály alapú tanulók viszont tökéletesen teljesítik a feladatot (célszerű nominális attribútumként beállítani a bemeneteket is)

Másik példa Próbáljuk ki a többi tanulót is, a hibaüzenetekből pedig kövessük, hogy milyen típusú bemeneteket várnak Egyesével változtassuk a paramétereket, figyelve azok hatását!

Érdeklődőknek A Repository mintapéldáival sok algoritmust ki lehet próbálni Érdemes megnézni az előfeldolgozókat és a validátorokat is

Jegyzőkönyv Beadandó Zip-be tömörítve bead_neptun.zip névvel A fájl tartalmazza: A négy előállított modellfájlt (Export/Model/Write Model) att6_id3.mod, att6_perc.mod, att2_id3.mod, att2_perc.mod Egy szöveges fájlt (results.txt), ahol a sorokban a fenti mérések konfidenciamátrixának adatai vannak sorfolytonosan, tab-bal elválasztva,a fenti sorrendben 32 0 100% 42 0 100% 100% 100%