Az R statisztikai és grafikai környezet



Hasonló dokumentumok
Az R statisztikai és grafikai környezet. Jeszenszky Péter Debreceni Egyetem, Informatikai Kar jeszenszky.peter@inf.unideb.hu

AWP TELEPÍTÉSE- WINDOWS7 64 OPERÁCIÓS RENDSZEREN

Vasúti információs rendszerek gyakorlat

Webes adatbázis-kezelés MySQL és PHP használatával

Adatok importálása R-ben

Linux Mint 8 telepítése

Prop-Tech. Vázmérő. Telepítési és eltávolítási útmutató

Programozás alapjai Bevezetés

#instagramads Az első tapasztalatok. Contact: Eva Drienyovszki Senior Search Specialist

Tartalomjegyzék. Tartalom 1/16

Párhuzamos programozás

ÚTMUTATÓ A KONTROLL ADATSZOLGÁLTATÁS ELKÉSZÍTÉSÉHEZ (2012-TŐL)

DocBook útmutató. Jeszenszky Péter Debreceni Egyetem, Informatikai Kar

HÁLÓZATSEMLEGESSÉG - EGYSÉGES INTERNET SZOLGÁLTATÁS-LEÍRÓ TÁBLÁZAT

Hálózat és rendszermenedzsmen ZABBIX

Tanúsítvány és hozzá tartozó kulcsok feltöltése Oberthur kártyára és Oberthur SIM termékre

Tisztítószerek és tisztító eszközök beszerzése (14669/2014.)- módosítás

E-ADÓ RENSZER HASZNÁLATI ÚTMUTATÓ

TANTÁRGYI ÚTMUTATÓ. Pénzügyi-számviteli informatika 2. tanulmányokhoz

Az első lépések. A Start menüből válasszuk ki a Minden program parancsot. A megjelenő listában kattintsunk rá az indítandó program nevére.

Shared IMAP beállítása magyar nyelvű webmailes felületen

Az új modulrendszer tapasztalatai

EPER E-KATA integráció

UNIX operációs rendszer rövid története és jellemzői

Beszámoló: a kompetenciamérés eredményének javítását célzó intézkedési tervben foglaltak megvalósításáról. Őcsény, november 20.

Korszerű geodéziai adatfeldolgozás Kulcsár Attila

Lemezkezelés, RAID, partícionálás, formázás, defragmentálás.

SAP JAM. Felhasználói segédlet

MEZŐGAZDASÁGI ALAPISMERETEK ÉRETTSÉGI VIZSGA II. A VIZSGA LEÍRÁSA

Számítógépes vírusok

CAD-CAM

Sikeres E-DETAILING KAMPÁNY receptje. GYÓGYKOMM KONFERENCIA Budapest, február 25. BALOGH JUDIT, PharmaPromo Kft.

Külső kártyaeszközök Felhasználói útmutató

TANTÁRGYI ÚTMUTATÓ. Prezentáció és íráskészségfejlesztés. tanulmányokhoz

Külső eszközök Felhasználói útmutató

Dr. Kulcsár Gyula. Virtuális vállalat félév. Projektütemezés. Virtuális vállalat félév 5. gyakorlat Dr.

A pedagógus-előmeneteli rendszer informatikai támogató rendszerének fejlesztése Fűrész Edit Budapest, október 27.

Első randi a QGIS SERVER környezettel

önkormányzati tanácsadó Kristonné Sipos Ágnes pályázati és közbeszerzési menedzser, Barcika Szolg Kft.

I. Országgyűlés Nemzeti Választási Iroda

Digitális technika (VIMIAA01) Laboratórium 1

Többfelhasználós adatbázis környezetek, tranzakciók, internetes megoldások

Az Európai Szabadalmi Egyezmény végrehajtási szabályainak április 1-étől hatályba lépő lényeges változásai

TMS Learning: Vezetői extrák

FTP-kapcsolat létrehozása FlashFXP alatt

THESECRET.HU. Megjelenési és hirdetési lehetőségek

Növekedési Hitelprogram

Gépi forgácsoló Gépi forgácsoló

Az aktiválódásoknak azonban itt még nincs vége, ugyanis az aktiválódások 30 évenként ismétlődnek!

Töltse ki értelemszerűen a vevő nevét, irányítószámát, település, utca házszám mezőket, valamint a partner adószáma mezőket.

Magyar. Biztonsági információk. Magyar

Az abortusz a magyar közvéleményben

Egységes fejlesztési katasztert támogató informatikai modul, önkormányzati projektmenedzserek lehetőségei

KÖZLEKEDÉSI ALAPISMERETEK (KÖZLEKEDÉS - ÜZEMVITEL, KÖZLEKEDÉS-TECHNIKA) KÖZLEKEDÉSI ALAPISMERETEK ÉRETTSÉGI VIZSGA II.

A Justh Zsigmond Városi Könyvtár panaszkezelési szabályzata

Jelentéskészítő TEK-IK () Válaszadók száma = 610

Számítógép-hálózatok Egyéni Feladat

Árverés kezelés ECP WEBSHOP BEÉPÜLŐ MODUL ÁRVERÉS KEZELŐ KIEGÉSZÍTÉS. v ECP WEBSHOP V1.8 WEBÁRUHÁZ MODULHOZ

Szusza Ferenc labdarúgó sportlétesítmény fejlesztése

Véleményezési határidő: november 26. Véleményezési cím:

Egyre nagyobb profitot generálnak a mobiltelefonnal végzett vásárlások, és egyre többet hezitálunk vásárlás előtt

A táblázatkezelő felépítése

Adattípusok. Szám: pozitív egész, egész, valós, dátum + idő,... Szöveg, Formázott szöveg Kép Hang Mozgókép+Hang

HIRDETMÉNY AKCIÓK, KEDVEZMÉNYEK

Boros Beáta projektmenedzser

Az éves statisztikai összegezés STATISZTIKAI ÖSSZEGEZÉS AZ ÉVES KÖZBESZERZÉSEKRŐL A KLASSZIKUS AJÁNLATKÉRŐK VONATKOZÁSÁBAN

Bár a digitális technológia nagyon sokat fejlődött, van még olyan dolog, amit a digitális fényképezőgépek nem tudnak: minden körülmények között

Vodafone ReadyPay. Használati útmutató

Nyugat-magyarországi Egyetem Geoinformatikai Kara. Nagy Gábor. Informatika 16. INF16 modul. Az OpenOffice.org

Dr. Schuster György február 21. Real-time operációs rendszerek RTOS

A beállítási segédprogram Használati útmutató

TELJESKÖRŰ ÜGYFÉLAZONOSÍTÁSI SZOLGÁLTATÁSOK

PÁLYÁZATI FELHÍVÁS - JELENTKEZÉSI LAP

Művesekezelés anyagainak beszerzése a Semmelweis Egyetem Transzplantációs és Sebészeti Klinika részére

DS409slim. Gyors telepítési útmutató

Új fejlesztéseink (NAT 2012) Középiskolai fizika, kémia

VÁLTOZÁSOK ÉS EREDMÉNYESSÉG: A DÉLUTÁNIG TARTÓ ISKOLA BEVEZETÉSÉNEK INTÉZMÉNYI TAPASZTALATAI

Keretszerződés költöztetési, szállítási feladatok ellátására a Pécsi Tudományegyetemen-2- AF módosítás

Informatikai Tesztek Katalógus

U 3000/U3100 Mini (Linux operációs rendszer alapú Eee PC számára) Gyors útmutató

Disk Station DS209, DS209+II

MATLAB. 4. gyakorlat. Lineáris egyenletrendszerek, leképezések

Project Management

Programozás I gyakorlat

Felhasználói Kézikönyv Kisbanki NetBOSS - IVR

Széchenyi István Egyetem Műszaki Tudományi Kar. A szakdolgozatok közös sablonja (a Kari Tanács i ülésén elfogadva)

Az NHB Növekedési Hitel Bank Zrt. tájékoztatója a lakossági kölcsönök feltételeiről Érvényes: május 01-től május 31-ig

2 Excel 2013 zsebkönyv

TOVÁBBI INFORMÁCIÓT TARTALMAZÓ HIRDETMÉNY, BEFEJEZETLEN ELJÁRÁSSAL KAPCSOLATOS INFORMÁCIÓ VAGY KORRIGENDUM

Segítünk online ügyféllé válni Kisokos

Tanúsítvány és hozzá tartozó kulcsok feltöltése Gemalto.NET kártyára

ELŐTERJESZTÉS a Veszprém Megyei Önkormányzat Közgyűlésének április 19-ei ülésére

Az éves statisztikai összegezés STATISZTIKAI ÖSSZEGEZÉS AZ ÉVES KÖZBESZERZÉSEKRŐL A KLASSZIKUS AJÁNLATKÉRŐK VONATKOZÁSÁBAN

Embléma, márkanév és szlogen 5

tartalmi szabályozók eredményesebb

Laborgyakorlat Logikai áramkörök számítógéppel segített tervezése (CAD)

MOBIL CROWDSENSING ÉS BIG DATA TÁVKÖZLÉSI ÉS MÉDIAINFORMATIKAI TANSZÉK BUDAPESTI MŰSZAKI ÉS GAZDASÁGTUDOMÁNYI EGYETEM

Áramlás- és zárószelepek Logikai szelep Logikai szelepek (ÉS / VAGY) Katalógus füzetek

G Szabályfelismerés feladatcsomag

Füzesabony Város Polgármesteri Hivatalának szervezetfejlesztése (ÁROP-1.A.2/A )

Átírás:

Az R statisztikai és grafikai környezet Jeszenszky Péter Debreceni Egyetem, Informatikai Kar jeszenszky.peter@inf.unideb.hu Utolsó módosítás: 2014. szeptember 30.

Mi az R? Nyílt forrású statisztikai és grafikai környezet Programozási nyelv és interaktív környezet egyben Az S programozási nyelv implementációjának tekinthető A megvalósításon a Scheme programozási nyelv hatása érezhető Nyílt forrású szoftverként bárki számára ingyenesen hozzáférhető Ez nem gátja az üzleti célú felhasználásnak 2

Jellemzők (1) Eszköztára megszámlálhatatlan klasszikus és modern statisztikai és matematikai eljárást tartalmaz Az alaprendszer részeként vagy csomagokban Kimagasló grafikus lehetőségekkel rendelkezik Kitűnően dokumentált Többféle platformon működik Futtatható (bináris) formában tölthető le a szoftver Windows, Mac OS X és Linux operációs rendszerekre Egyéb platformok esetében a forrásokból kell a rendszert lefordítani 3

Jellemzők (2) Interpretált nyelv A felhasználók által látható függvények nagy része R- ben készült Számításigényes feladatok megoldásához C, C++ és FORTRAN eljárásokat is meg lehet hívni Mint programozási nyelv a funkcionális és objektum-orientált programozási paradigmákat ötvözi Elegáns és tömör szintaxis jellemzi 4

Jellemzők (3) Tudás és sebesség tekintetében is méltó versenytársa a hasonló célú kereskedelmi programoknak Egyszerűen elsajátítható a használata, hamar megszerethető (szubjektív vélemény) 5

Fejlesztés Az eredeti fejlesztők Ross Ihaka és Robert Gentleman (Department of Statistics, University of Auckland, Új- Zéland) A fejlesztést 1997 óta az R Development Core Team tartja kézben A csoport tagja John Chambers, az S programozási nyelv atyja Az R Foundation az R Development Core Team tagjai által alapított non-profit szervezet Célja az R projekt támogatása Az R-rel kapcsolatos copyright jogok tulajdonosa (szoftver és dokumentáció) 6

Elnevezés Az R az eredeti szerzők nevének kezdőbetűje Játék az S programozási nyelv nevével GNU S-nek is nevezik, mivel az R hivatalosan is a GNU projekt része 7

Nyílt forrású szoftver GNU GPL licenc alatt terjesztik http://www.gnu.org/copyleft/gpl.html A legismertebb és legelterjedtebb nyílt forrású szoftver licenc A legtöbb csomag szintén ilyen licenc alatt hozzáférhető, de lehet eltérés Esetenként előfordulhat, hogy az üzleti célú felhasználás korlátozott (üzleti felhasználás esetén érdemes megnézni a csomag licencét) A nem üzleti célú felhasználás azonban nincs korlátozva (természetesen a GPL-nek megfelelően kell eljárni) 8

GNU GPL A program szabadon másolható, terjeszthető (akár pénzért is) és módosítható Az eredeti programot és módosított változatait is forráskód formájában, a licenc alatt kötelező terjeszteni Ez biztosítja, hogy valamennyi az eredeti programból származtatott mű is szabad maradjon Nem zárja ki az üzleti célú felhasználást Csak a másolás, terjesztés és módosítás tartozik a licenc hatálya alá 9

CRAN The Comprehensive R Archive Network http://cran.r-project.org/ Ugyanazt a tartalmat kínáló, földrajzilag a világ különböző részein található FTP és webszerverek hálózata, valamennyi szerveren elérhető: A legutóbbi stabil és az összes korábbi R verzió több platformra, bináris (telepíthető) formában Az összes korábbi és jelenleg fejlesztés alatt álló verzió forráskódban A teljes dokumentáció Az összes csomag 10

Telepítés A jelenleg aktuális verzió az R 3.1.1 (megjelenés: 2014. július 10.) A CRAN szerverekről lehet letölteni bináris, futtatható formában a telepítőcsomagokat Windows, Linux és Mac OS X platformra Más platformra forrásból telepíthető Windows környezetben a telepítés után rendelkezésre áll egy RGui nevű grafikus felhasználói felületet, amelyet a Linux verzió nem tartalmaz 11

Dokumentáció A telepítés után elérhető egy nagyon részletes és átfogó online dokumentáció, amely több kézikönyvből áll, valamint a telepített csomagok dokumentációjából A dokumentáció többféle módon kereshető, böngészőprogramban is megjeleníthető Az R saját, a LaTex-hez hasonló dokumentációs formátumot használ A dokumentációs oldalak átalakíthatók LaTeX (így PDF) és HTML formátumba, közönséges szöveges állományokká 12

Felhasználói közösség Népes a felhasználók tábora Számtalan statisztikus, biológus, közgazdász, orvos és pszichológus használja Az R-help levelezési listán kérhető segítség (feliratkozás szükséges) http://stat.ethz.ch/mailman/listinfo/r-help Merjünk kérdezni, szívesen segítenek, általában nem kell sokat várni a válaszra Nagy forgalom, naponta akár 100 levél 13

Kapcsolódó folyóiratok Journal of Statistical Software http://www.jstatsoft.org/ Volume 49 Special Volume: Graphical User Interfaces for R Volume 44 Special Volume: Magnetic Resonance Imaging in R Volume 27 Special Volume: Econometrics in R Volume 22 Special Volume: Ecology and Ecological Modelling in R The R Journal http://journal.r-project.org/ 14

Használat A legtöbb felhasználó interaktív módon használja, de természetesen lehetőség van programok készítésére és futtatására Hibák felderítéséhez van nyomkövetési lehetőség 15

S Statisztikai programozási nyelv, amelynek kifejlesztése elsősorban John Chambers nevéhez fűződik Története az 1970-es évek közepéig nyúlik vissza Több verzió létezett az idők folyamán, a legutóbbi az S Version 4 (S4), amelynek leírása az alábbi könyvben ( Green Book ): John M. Chambers (1998), Programming with Data: Guide to the S Language. New York: Springer. Két mai, modern implementációja létezik a nyelvnek, az R és az S-PLUS 16

S-PLUS Az S programozási nyelv kereskedelmi implementációja Eredetileg az Insightful Corporation terméke, a céget azonban 2008-ban felvásárolta a TIBCO Software A jelenleg aktuális verzió a 2010-ben megjelent Spotfire S+ 8.2 Comprehensive S-PLUS Archive Network http://csan.insightful.com/ A legtöbb csomag nyílt forrású és elérhető a CRAN szervereken is (eleve úgy készülnek, hogy működjenek mindkét környezetben) 17

Különbségek az R és S között (1) Mivel az R az S implementációjának tekinthető, az eltérés az R és az összes többi S implementáció (így a különböző S-PLUS verziók) között értendő Bizonyos eltérések oka az, hogy a fejlesztők az S viselkedését esetenként nem tartották letisztultnak (logikusnak, konzekvensnek, pontosan tisztázottnak, ) A cél egy letisztultabb, ugyanakkor az S-sel a lehető legnagyobb mértékben kompatibilis implementáció létrehozása volt 18

Különbségek az R és S között (2) Olyan grafikus lehetőségekkel is rendelkezik az R, amelyekkel a többi implementáció nem: Nem csupán a beépített vonaltípusok állnak rendelkezésre, hanem tetszőleges vonaltípus megadható Az S-PLUS 8-ban csak 8 beépített vonaltípus használható Fejlettebb színkezelés (például gamma-korrekció) Az R a TeX-hez hasonlóan képes matematikai formulákat megjeleníteni Viszont az S-PLUS is rendelkezik néhány olyan grafikus lehetőséggel, amelyekkel az R nem 19

Különbségek az R és S között (3) A legfontosabb eltérés az, hogy az összes többi implementációhoz képest az R hatáskörkezelése statikus A statikus hatáskörkezelés következményeként az R valamennyi objektumot a memóriában tárol Emiatt gyorsabb Azonban R összeomlása esetén valamennyi adat elvész, amennyiben nem végeztünk explicit módon mentést 20

Az R-re épülő szabad és nyílt forrású szoftverek Deducer: A GUI for R http://www.deducer.org/ (GNU GPL) Rattle: A Graphical User Interface for Data Mining using R http://rattle.togaware.com/ (GNU GPL) RKWard http://rkward.sourceforge.net/ (GNU GPL) RStudio http://rstudio.org/ (GNU AGPL) 21

Az R-re épülő nem szabad szoftverek Revolution Analytics http://www.revolutionanalytics.com/ Revolution R Enterprise: Enterprise-class big data big analytics platform Párhuzamos feldolgozási architektúra, mely támogatja a munkaállomás környezetben és klaszterben történő futtatást is Egy módosított R disztribúció képezi az alapját, mely a GNU GPL hatálya alatt érhető el http://www.revolutionanalytics.com/gpl-sources 22

Összehasonlítás hasonló szoftverekkel (1) Speed comparison of various number crunching packages (version 2) (08/03/2003) http://www.sciviews.org/benchmark/ Sajnos régi Az alábbi programok összehasonlítása: R 1.9.0, S- PLUS 6.1, Matlab 6.0, O-Matrix 5.6, Octave 2.1.42, Scilab 2.7, Ox 3.30 Sokféle teszt (FFT, sajátérték számítás, mátrix invertálás, rendezés, ) Nagyon kedvező eredmények az R-re nézve 23

Összehasonlítás hasonló szoftverekkel (2) Matlab vs. R performance benchmarking http://mlg.eng.cam.ac.uk/dave/rmbenchmark.html Matlab 2008b és R 2.8.0 összehasonlítás (mátrixműveletek, FFT, sajátérték számítás, ) Egy sokrétű összehasonlítás (rendelkezésre állás, támogatott platformok, eszköztár) http://en.wikipedia.org/wiki/comparison_of_statistical_ 24

Csomagok (1) A rendszer telepítése során a számítógépre kerülnek az alap- és ajánlott csomagok Számos további csomag érhető el a CRAN szerverekről és egyéb helyekről, amelyek további képességekkel bővítik a rendszer Csomagok telepítéséhez használjuk az interpreterben az install.packages() függvényt Windows platformon csomagok telepítése elvégezhető az RGui Packages menüjének Install package(s) menüpontjával is 25

Csomagok (2) Windows és Mac OS X platformra a csomagok bináris formában kerülnek letöltésre A források természetesen megtalálhatók a CRAN szervereken Linux platformra forrásban történik a csomagok letöltése, a C, C++ és FORTRAN források lefordítása lokálisan Ehhez tipikusan rendelkezésre állnak a gcc (C, C++) és g77 (FORTRAN) fordítóprogramok Csomagfüggőségek kezelése 26

Alap- és ajánlott csomagok Az alábbi 14 alapcsomag alkotja az R-t: base, compiler, datasets, grdevices, graphics, grid, methods, parallel, splines, stats, stats4, tcltk, tools, utils Valamennyi bináris disztribúció tartalmazza továbbá az alábbi 15 ajánlott csomagokat: boot, class, cluster, codetools, foreign, KernSmooth, lattice, MASS, Matrix, mgcv, nlme, nnet, rpart, spatial, survival 27

További csomagok (1) További csomagokat a CRAN szervereken találunk Ezeken jelenleg 5800-nál több csomag áll rendelkezésre! Egyéb projektek keretében készült csomagok nincsenek feltüntetve, így az összes R csomag száma nagyobb ennél! 28

További csomagok (2) Bioconductor (bioinformatikai R csomagok) http://www.bioconductor.org/ 800-nál több további professzionális R csomag R-Forge http://r-forge.r-project.org/ 29

Csomagok tematikus csoportosítása Az átláthatóság érdekében a CRAN szervereken a csomagokat tematikusan csoportosítva is lehet böngészni (nézetek) Jelenleg 33 nézet (Finance, Graphics, MachineLearning, MedicalImaging, NaturalLanguageProcessing, Optimization, ) Érdemes telepíteni a nézetek kezelését támogató ctv (CRAN Task Views) csomagot 30

Egy hasznos csomag csomagok telepítéséhez Nézetek kezelését támogatja a ctv csomag A rendelkezésre álló nézeteket az available.views() függvénnyel lehet listázni Az install.views() függvénnyel lehet telepíteni az adott csoportba tartozó csomagokat Például az install.views("machinelearning") paranccsal lehet telepíteni a gépi tanuláshoz kötődő csomagot 31

IO lehetőségek Objektumok tárolása állományokban Szöveges állományok Csatlakozás adatbázis-kezelő rendszerekhez Hálózati kommunikáció Excel állományok feldolgozása Egyéb IO lehetőségek 32

Objektumok tárolása állományokban Az objektumokat állományokba lehet menteni A save() függvény az argumentumként adott objektumokat menti A save.image() függvény valamennyi a memóriában tárolt objektumot menti Az így elmentett állományokat a load() függvénnyel lehet a memóriába betölteni A tárolás az R saját bináris formátumában történik 33

Szöveges állományok Táblázatos adatokat lehet beolvasni szöveges állományokból a read.table(), read.csv() és read.delim() függvényekkel A write.table() és write.csv() függvényekkel lehet táblázatos adatokat szöveges állományokba írni Ez a legbiztonságosabb módja a más szoftverekkel állományokon keresztül történő kommunikációnak Ilyen állományokat minden szoftver tud írni és olvasni 34

Csatlakozás adatbázis-kezelő rendszerekhez (1) Több csomag áll rendelkezésre, amelyek különböző absztrakciós szintűek Mindegyik lehetővé teszi SQL lekérdezések végrehajtását és a teljes eredménytábla beolvasását, vagy az eredménytábla részekben beolvasását Némelyik lehetővé teszi adatok beolvasását és kiírását SQL közvetlen használata nélkül 35

Csatlakozás adatbázis-kezelő rendszerekhez (2) RODBC csomag: Csatlakozás ODBC interfészen keresztül (szinte minden adatbázis-kezelő rendszer támogatja) MS SQL Server, MS Access, MySQL, Oracle PostgreSQL, A Windows még Excel és szöveges állományokhoz is biztosít ODBC meghajtót Ez lehetővé teszi Excel táblák feldolgozását (nem szükséges, hogy az Excel telepítve legyen) Windows rendszerekben az ODBC támogatás általában alapértelmezésben telepítve van Linux környezetben ODBC meghajtó kezelő program telepítése szükséges Két nyílt forrású megoldás: unixodbc http://www.unixodbc.org/, iodbc http://www.iodbc.org/ 36

Csatlakozás adatbázis-kezelő rendszerekhez (3) DBI csomag: Speciálisan az R és az adatbázis-kezelő rendszerek közötti kommunikáció megvalósításához készült interfész csomag Front-end csomag, valamennyi adatbázis-kezelő rendszerhez megfelelő back-end csomag szükséges Jelenleg rendelkezésre álló back-end csomagok: RH2, RJDBC, RMySQL, ROracle, RPostgreSQL, RSQLite 37

Hálózati kommunikáció Az állományokat beolvasó függvényeknek, mint például a read.csv(), read.table() és a scan() állománynevek helyett URL-eket is meg lehet adni A download.file() függvény állományok letöltésére szolgál Az url.show() pedig URL-ekkel adott állományok tartalmának megjelenítésére 38

Excel állományok feldolgozása (1) A legbiztonságosabb megoldás szöveges állományokba exportálni az Excel állományokat Windows rendszerekben egy lehetőség az RODBC csomag használata Akár több munkalap is lehet az állományban 39

Excel állományok feldolgozása (2) Kizárólag Windows környezetben használható csomagok, melyek írni és olvasni is képesek Excel állományokat: xlsreadwrite http://www.swissr.org/software/xlsreadwrite excel.link A gdata csomag read.xls() függvénye Excel állományok beolvasására szolgál A függvény az Excel állományt CSV állománnyá alakítja egy Perl programmal Perl telepítése szükséges 40

Excel állományok feldolgozása (3) A WriteXLS csomag WriteXLS() függvénye adatok kiírását teszi lehetővé Excel 2003 (.xsl) és Excel 2007 (.xlsx) állományokba Perl szükséges a használathoz 41

Excel állományok feldolgozása (4) XLConnect és xlsx csomag Platformfüggetlen megoldások Excel állományok olvasásához és írásához Használatukhoz Java szükséges Az Apache POI könyvtáron alapulnak http://poi.apache.org/ openxlsx: Az XLConnect és az xlsx csomagokhoz hasonló platformfüggetlen megoldás, melyhez Java sem szükséges 42

Egyéb IO lehetőségek A base csomag gzcon(), gzfile(), bzfile(), xzfile() és unz() függvényei: adattömörítés (gzip, bzip2, xz, ZIP) jpeg, png, readbitmap: képállományok írása és beolvasása audio, tuner, seewave: hangállományok feldolgozás (FLAC, MP3, WAV) XML csomag: XML dokumentumok írása és beolvasása Csomagok speciális formátumok kezeléséhez: gdsfmt, ncdf, R4CDISC, rgexf, RNetCDF, Rpdb, 43

Hivatkozások The R Project for Statistical Computing http://www.r-project.org/ Kurt Hornik (2014), The R FAQ. http://cran.r-project.org/doc/faq/r-faq.html Brian Ripley et. al (2014), R Data Import/Export. http://cran.r-project.org/doc/manuals/r-data.html Különböző csomagok dokumentációja http://cran.r-project.org/web/packages/ 44