i RapidMiner telepítés
ii COLLABORATORS TITLE : RapidMiner telepítés ACTION NAME DATE SIGNATURE WRITTEN BY Jeszenszky, Péter 2014. szeptember 17. REVISION HISTORY NUMBER DATE DESCRIPTION NAME
iii Tartalomjegyzék 1 RapidMiner telepítés 1 2 Az R Extension telepítése 1 2.1 Windows....................................................... 1 2.1.1 R telepítés.................................................. 1 2.1.2 JAVA_HOME környezeti változó beállítás.................................. 1 2.1.3 rjava és JavaGD telepítés......................................... 1 2.1.4 R_HOME és PATH környezeti változó beállítás............................... 1 2.1.5 R Extension telepítés........................................... 2 2.1.6 RapidMiner újraindítás............................................ 3 2.2 Linux......................................................... 3 2.2.1 R telepítés.................................................. 3 2.2.2 JDK telepítés................................................. 3 2.2.3 rjava és JavaGD telepítés......................................... 3 2.2.3.1 R_HOME és PATH környezeti változó beállítás.......................... 4 2.2.3.2 R Extension telepítés..................................... 4 2.2.3.3 RapidMiner újraindítás...................................... 5 3 JDBC meghajtóprogramok telepítése 5 3.1 HSQLDB....................................................... 6 3.2 Oracle......................................................... 6 4 Hivatkozások 6
iv Ábrák jegyzéke 1. Az R Extension telepítési leírása (Windows)................................... 2 2. A jri.dll állomány kiválasztása (Windows)................................... 2 3. Az R Extension telepítésének befejezése (Windows).............................. 3 4. Az ikonsor az R Extension telepítése után (Windows).............................. 3 5. Az R Extension telepítési leírása (Linux).................................... 4 6. A libjri.so állomány kiválasztása (Linux).................................... 5 7. Az ikonsor az R Extension telepítése után (Linux)................................ 5 Kivonat A dokumentum a RapidMiner program telepítésével és beállításával kapcsolatos témákat tárgyal.
1 / 7 1. RapidMiner telepítés A RapidMiner Windows és Linux rendszerekben is telepíthető rendszergazdaként. Ennek nyilvánvaló előnye az, hogy a program minden felhasználó számára rendelkezésre áll a továbbiakban. Ebben az esetben viszont a Help Update RapidMiner... menüpont kiválasztásával csak a rendszergazda képes az alaprendszer frissítésére, további csomagokat azonban minden felhasználó telepíthet. megjegyzés A szerző Linux alatt rendszergazdaként az /opt könyvtárba telepítette a programot. 2. Az R Extension telepítése Az R Extension az R statisztikai és grafikai környezetet [4] integrálja a RapidMiner-be. Telepítése sajnos nem teljesen automatikusan történik, hanem»kézi«beállításokat is igényel. A szakasz lépésről-lépésre haladva mutatja be a telepítés menetét. 2.1. Windows 2.1.1. R telepítés Telepítsük az R-t, mely a http://cran.r-project.org/bin/windows/base/ oldalról tölthető le. A jelenleg aktuális verzió a 3.1.1 számú. 2.1.2. JAVA_HOME környezeti változó beállítás Be kell állítani a JAVA_HOME környezeti változót, melynek értékeként a Java installációt tartalmazó könyvtár elérési útvonalát kell megadni. Ha a számítógépünkre telepítve van az Oracle Java fejlesztői csomagja (JDK) akkor a környezeti változó értéke legyen az ezt tartalmazó könyvtár elérési útvonala. Például a szerző számítógépén ez C:\Program Files\Java\jdk1.8.0_05. Az sem baj, ha nincs JDK telepítve, mivel a RapidMiner részeként is kapunk egy Java futtató környezetet (JRE). Ebben az esetben az ezt tartalmazó könyvtár elérési útvonalát kell megadni a környezeti változó értékeként. Például a szerző számítógépén ez C:\Program Files\Rapid-I\RapidMiner5\jre. 2.1.3. rjava és JavaGD telepítés Indítsuk el az R-t adminisztrátor jogosultsággal és telepítsük benne az rjava csomagot [5], mely lehetővé teszi az R számára Java objektumok használatát, valamint a JavaGD grafikus eszközmeghajtó csomagot [3], mely a grafikus kimenet Java alkalmazásokhoz történő átirányítására szolgál. A telepítés elvégezhető a parancsértelmezőben az > install.packages(c("rjava", "JavaGD")) parancs végrehajtásával vagy a Packages Install package(s)... menüpont kiválasztásával. Mindkét esetben megjelenik egy CRAN mirror című ablak, melyben a csomagok letöltéséhez ki kell választani egy szervert. Bármelyik megfelelő, de célszerű egy földrajzilag közelebbi választása, a szerző az ausztriai szervert ajánlja. 2.1.4. R_HOME és PATH környezeti változó beállítás Állítsuk be az R_HOME környezeti változót, melynek értékeként az R installációt tartalmazó könyvtár elérési útvonalát kell megadni. Ez például a szező számítógépén C:\Program Files\R\R-3.1.1. A PATH környezeti változó értékéhez pedig adjuk hozzá annak a könyvtárnak az elérési útvonalát, melyben az R részeként kapott R.dll állomány található. Ez az R 2.12.0 és magasabb számú verziói esetén %R_HOME%\bin\i386 illetve %R_ HOME%\bin\x64 32-bites operációs rendszer esetén az előbbit, 64-bites esetén pedig az utóbbi kell használni, korábbi verziók esetén pedig %R_HOME%\bin.
2 / 7 2.1.5. R Extension telepítés Indítsuk el a RapidMiner programot és telepítsük benne az R Extension kiterjesztést a Help Updates and Extensions (Marketplace)... menüpont kiválasztásával. A kiterjesztés telepítése után a programot újra kell indítani. Az újraindítás után meg fog jelenni egy olyan ablak, mely a telepítés és beállítás lépéseit ismerteti, itt a Select JRI library file gombra kattintva mehetünk tovább (1. ábra). 1. ábra. Az R Extension telepítési leírása (Windows) A 2. ábra azt a következő ablakot mutatja, melyben meg kell keresnünk az állományrendszerben az rjava csomaghoz tartozó jri.dll állományt. Például a szerző számítógépén az állomány a C:\Program Files\R\R-3.1.1\library\ rjava\jri\x64 könyvtárban található. tipp A jri.dll állomány helyének meghatározásához az R parancsértelmezőjében hajtsuk végre a >.libpaths() parancsot. Az állományt a parancs eredményeként kapott könyvtárak valamelyikében találjuk az rjava\jri\i386 illetve a rjava\jri\x64 alkönyvtárban. 32-bites operációs rendszer esetén az előbbiben, 64-bites esetén pedig az utóbbiban lévő jri.dll-t kell használni. 2. ábra. A jri.dll állomány kiválasztása (Windows) A jri.dll állomány kiválasztása után az Manually restart RapidMiner gombot megnyomva lépjünk ki a programból (3. ábra).
3 / 7 3. ábra. Az R Extension telepítésének befejezése (Windows) 2.1.6. RapidMiner újraindítás Ha sikeres volt a telepítés, akkor a RapidMiner következő indításánál az ablak tetején az ikonsorban megjelenik az R Extension ikonja (4. ábra). 4. ábra. Az ikonsor az R Extension telepítése után (Windows) 2.2. Linux Az alábbi leírás az Ubuntu és Linux Mint rendszerekben történő telepítés menetét ismerteti. 2.2.1. R telepítés Telepítsük az R-t, melyhez a $ sudo apt-get install r-base parancsot kell végrehajtani. 2.2.2. JDK telepítés Telepítsük az Oracle JDK-t. A telepítés során gondoskodjunk arról is, hogy kerüljön beállításra a JAVA_HOME környezeti változó, melynek értékeként a JDK installációt tartalmazó könyvtár elérési útvonalát kell megadni. Például a szerző számítógépén a beállítást az /etc/profile.d/jdk.sh állomány tartalmazza az alábbi módon:... export JAVA_HOME=/usr/lib/jvm/java-8-oracle... 2.2.3. rjava és JavaGD telepítés figyelem Az alábbiakhoz szükséges, hogy megfelelően be legyen állítva a JAVA_HOME környezeti változó! Telepítsük az rjava csomagot [5], mely lehetővé teszi az R számára Java objektumok használatát, valamint a JavaGD grafikus eszközmeghajtó csomagot [3], mely a grafikus kimenet Java alkalmazásokhoz történő átirányítására szolgál. A telepítést az alábbi parancsok végrehajtásával végezzük el: $ sudo R CMD javareconf $ sudo R > install.packages(c("rjava", "JavaGD")) > q("no") A csomagok telepítése során megjelenik egy CRAN mirror című ablak, melyben a letöltéséhez ki kell választani egy szervert. Bármelyik megfelelő, de célszerű egy földrajzilag közelebbi választása, a szerző az ausztriai szervert ajánlja.
4 / 7 2.2.3.1. R_HOME és PATH környezeti változó beállítás Állítsuk be az R_HOME környezeti változót, melynek értékeként az R installációt tartalmazó könyvtár elérési útvonalát kell megadni. Ez például a szező számítógépén /usr/lib/r. A PATH környezeti változó értékéhez pedig adjuk hozzá az $R_ HOME/bin könyvtárat. A beállításokhoz hozzuk létre az /etc/profile.d/rapidminer.sh állományt az alábbi tartalommal: export R_HOME=/usr/lib/R export PATH=$PATH:$R_HOME/bin 2.2.3.2. R Extension telepítés megjegyzés Ezt a lépést már nem szükséges rendszergazdaként végezni akkor sem, ha a RapidMiner programot rendszergazdaként telepítettünk. Minden egyes felhasználó saját maga is elvégezheti az alábbiakat. Viszont az R_HOME és PATH környezeti változók megfelelően be kell, hogy legyenek állítva! Indítsuk el a RapidMiner programot és telepítsük benne az R Extension kiterjesztést a Help Updates and Extensions (Marketplace)... menüpont kiválasztásával. A kiterjesztés telepítése után a programot újra kell indítani. Az újraindítás után meg fog jelenni egy olyan ablak, mely a telepítés és beállítás lépéseit ismerteti, itt a Select JRI library file gombra kattintva mehetünk tovább (5. ábra). 5. ábra. Az R Extension telepítési leírása (Linux) A 6. ábra azt a következő ablakot mutatja, melyben meg kell keresnünk az állományrendszerben az rjava csomaghoz tartozó libjri.so állományt. Ez például a szező számítógépén az /usr/local/lib/r/site-library/rjava/jri/ könyvtárban található.
5 / 7 tipp A következő módon állapíthatjuk meg, hogy hol található a szóban forgó libjri.so állomány. Indítsuk el az R-t és hajtsuk végre az alábbit: >.libpaths() A kimenetben megjelenő valamely könyvár alatt találjuk az rjava/jri/ könyvtárat, mely az állományt tartalmazza. 6. ábra. A libjri.so állomány kiválasztása (Linux) A libjri.so állomány kiválasztása után a Manually restart RapidMiner gombot megnyomva lépjünk ki a programból. 2.2.3.3. RapidMiner újraindítás Ha sikeres volt a telepítés, akkor a RapidMiner következő indításánál az ablak tetején az ikonsorban megjelenik az R Extension ikonja (7. ábra). 7. ábra. Az ikonsor az R Extension telepítése után (Linux) 3. JDBC meghajtóprogramok telepítése A RapidMiner részeként több JDBC meghajtóprogramot is kapunk, melyek lehetővé teszik különböző relációs adatbáziskezelőrendszerek elérését. Sajnos azonban a program nem biztosít Oracle JDBC meghajtóprogramokat, és a tartalmazott HSQLDB [1] meghajtóprogram sem a legfrissebb. A szakasz ezeknek a hiányosságoknak a kiküszöbölésére ad megoldást [2] alapján. A JDBC meghajtóprogramokat a RapidMiner installációt tartalmazó könyvtárban kell elhelyezni a lib\jdbc (Windows) illetve lib/jdbc (Linux) alkönyvtárban. Ez például a szerző számítógépén Windows alatt a C:\Program Files\Rapid-I\ RapidMiner5\lib\jdbc könyvtár.
6 / 7 3.1. HSQLDB A HSQLDB legutóbbi stabil verziója a 2.3.2 számú, a RapidMiner pedig jelenleg a korábbi 1.8 verzióhoz tartalmaz meghajtóprogramot, mely az újabb HSQLDB verziókhoz nem használható. Töltsük le a http://sourceforge.net/projects/hsqldb/files/hsqldb/ oldalról a program megfelelő verzióját, melyet egy hsqldb-x.y.z.zip nevű állomány tartalmaz. A tömörített állományban található hsqldb-x.y.z/ hsqldb/lib/hsqldb.jar állománnyal írjuk felül az állományrendszerben a korábbi hsqldb.jar állományt. 3.2. Oracle A http://www.oracle.com/technetwork/database/features/jdbc/index-091264.html oldalról tölthetjük le az Oracle JDBC meghajtóprogramokat. Például az Oracle Database 11g verziókhoz az ojdbc6.jar állományt kell letölteni és elhelyezni a fenti könyvtárba. fontos Az órai munkához az Oracle Database 11g Release 1 meghajtóprogramokat válasszuk. A RapidMiner programot futtató felhasználók.rapidminer könyvtárába el kell helyezni az alábbi tartalmú konfigurációs állományt jdbc_properties.xml néven, ahol a 4. sorban értelemszerűen a meghajtóprogam elérési útvonalát kell megadni: 1 <drivers> 2 <driver name="oracle" 3 drivers="oracle.jdbc.driver.oracledriver" 4 driver_jar="c:\program Files\Rapid-I\RapidMiner5\lib\jdbc\ojdbc6.jar" 5 defaultport="1521" 6 urlprefix="jdbc:oracle:thin:@" 7 dbnameseperator=":" 8 type_varchar="varchar2" 9 type_text="blob" 10 type_integer="integer" 11 type_real="real" 12 type_time="time" 13 type_date="date" 14 type_datetime="timestamp" 15 identifier_quote_open="'" 16 identifier_quote_close="'" 17 value_quote_open=" " 18 value_quote_close=" "/> 19 </drivers> Linux rendszerekben a konfigurációs állomány helye az állományrendszerben a $HOME/.RapidMiner5 könyvtárban van. Windows alatt például a szerző számítógépén a C:\Felhasználók\Jeszy\.RapidMiner5 könyvtárban kellett elhelyezni az állományt. megjegyzés A szerző tapasztalatai szerint az Oracle JDBC meghajtó Linux alatt a jdbc_properties.xml állomány nélkül is használható. 4. Hivatkozások [1] HSQLDB (HyperSQL Database), http://hsqldb.org/.
7 / 7 [2] JDBC Drivers Rapid-I-Wiki, http://rapid-i.com/wiki/index.php?title=jdbc_drivers. [3] rjava Java Graphics Device, http://www.rforge.net/javagd/. [4] The R Project for Statistical Computing, http://www.r-project.org/. [5] rjava Low-level R to Java interface, http://www.rforge.net/rjava/.