Kiss Ferenc, hunfek@mvs.sas.com SAS Institute. Abstract



Hasonló dokumentumok
The nontrivial extraction of implicit, previously unknown, and potentially useful information from data.

A szak specializációi

A gazdaságinformatikus mesterszak tantervi hálója

Infor PM10 Üzleti intelligencia megoldás

TDK tájékoztató Gazdaságinformatika Intézeti Tanszék szeptember

Vezetői információs rendszerek

PROGRAMTERVEZŐ INFORMATIKUS ALAPKÉPZÉSI SZAK

Szak neve: Gazdaságinformatikus MSc Szakfelelős: Csendes Tibor Nappali tagozat félévek

Egyetemi szintű Közgazdasági programozó matematikus szak nappali tagozat (GEEP)

SZAKDOLGOZATI TÉMAKÖRÖK

Gazdasági informatika alapjai

Mesterséges Intelligencia Elektronikus Almanach. Konzorciumi partnerek

Pénzügyi és Számviteli Intézet intézetvezető: Prof. Dr. Vigvári András CSc. Számvitel Intézeti Tanszék

Az ellátásilánc-menedzsment, és informatikai háttere. BGF PSZK Közgazdasági Informatikai Intézeti Tanszék Balázs Ildikó, Dr.

Tartalom. Jó hogy jön Jucika, maga biztosan emlékszik még, hányadik oldalon van a Leszállás ködben.

Az információs rendszerek funkcionális változásai a kis és középvállalkozások szemszögéből. DE ATC AVK Gazdasági- és Agrárinformatikai Tanszék

KÖSZÖNTJÜK HALLGATÓINKAT!

A hierarchikus adatbázis struktúra jellemzői

Alkalmazott matematikus mesterszak MINTATANTERV

2006. szeptemberétől. kódja

Projektvezetői döntések támogatása webbányászattal

Kurzus címe, típusa (ea, sz, gy, lab, konz stb.) Tárgyfelelős Előfeltétel (kurzus kódja) Előfeltétel típusa

Név KP Blokk neve KP. Logisztika I. 6 LOG 12 Dr. Kovács Zoltán Logisztika II. 6 Logisztika Dr. Kovács Zoltán

Mi legyen az informatika tantárgyban?

Beszerzési és elosztási logisztika. Előadó: Telek Péter egy. adj. 2008/09. tanév I. félév GT5SZV

VÁLLALATI INFORMÁCIÓS RENDSZEREK. Debrenti Attila Sándor

Gazdasági informatikus mesterszak

30 MB INFORMATIKAI PROJEKTELLENŐR

Piaci alapú kutatás-fejlesztések a Pannon Egyetemen

IK Algoritmusok és Alkalmazásaik Tsz, TTK Operációkutatás Tsz. A LEMON C++ gráf optimalizálási könyvtár használata

Mérnökinformatikus alapszak (BSc)

TANTÁRGYI ADATLAP I. TANTÁRGYLEÍRÁS

Az alkalmazás minőségbiztosítás folyamata Fókuszban a teszt-automatizálás

Lukovich Gábor Logisztikai rendszerfejlesztő

Kurzuskód Kurzus címe, típusa (ea, sz, gy, lab, konz stb.) Tárgyfelelős Előfeltétel (kurzus kódja) típusa

Megszületett a digitális minőségügyi szakember? XXIV. Nemzeti Minőségügyi Konferencia

Logisztikai szimulációs módszerek

Szimulációs módszerek alkalmazása az üzleti döntéstámogatásban

Pénzügy és számvitel

Számítógépes döntéstámogatás. Bevezetés és tematika

RAKTÁROZÁS MENEDZSMENT

Programtervező informatikus BSc 2018, Szoftverfejlesztő specializáció ajánlott tantervi háló. Törzsanyag. Konzultáció Kredit

Oktatott tárgyak a 2017/18. tanév I. félévében

Az informáci. Forczek Erzsébet SZTE, ÁOK Orvosi Informatikai Intézet május

Műszaki menedzser mesterszak javasolt előtanulmányi rend

Változások előtt hol áll a banki (adat)elemzés? Nándorfi György

Matematika alapszak (BSc) 2015-től

MARKETING MESTERKÉPZÉSI SZAK

BA 2010 / BA 2012 ekvivalencia táblázat

Vezetői információs rendszerek

Statisztika oktatása és alkalmazása a mérnöki területen

MÉRNÖKINFORMATIKUS ALAPSZAK TANULMÁNYI TÁJÉKOZATÓ 2017.

TANTERV érvényes a as tanévtől kezdődően BABEŞ-BOLYAI TUDOMÁNYEGYETEM KOLOZSVÁR KÖZGAZDASÁG- ÉS GAZDÁLKODÁSTUDOMÁNYI KAR

Termelés- és szolgáltatásmenedzsment Részidős üzleti mesterszakok

Gyakornoki álláslehetőségek a Robert Bosch Elektronika Kft.-nél

TANTÁRGYI ÚTMUTATÓ. Alkalmazott számítástechnika. tanulmányokhoz

FELVÉTELI BEMENETI KÖVETELMÉNYEK A MISKOLCI EGYETEM MESTERKÉPZÉSI SZAKJAIRA

Miskolci Egyetem Gépészmérnöki és Informatikai Kar Alkalmazott Informatikai Tanszék. Dr. Kulcsár Gyula egyetemi docens

Mérnök informatikus mesterszak mintatanterve (GE-MI) nappali tagozat/ MSc in, full time Érvényes: 2011/2012. tanév 1. félévétől, felmenő rendszerben

TANTERV - érvényes a es tanévtől

Minőségmenedzsment (módszerek) BEDZSULA BÁLINT

SAS szoftverek felhasználási lehetőségei a felsőoktatásban

Termelési és szolgáltatási döntések elemzése Vezetés és szervezés mesterszak

Dr. Sasvári Péter Egyetemi docens

1. Az informatika alapjai (vezetője: Dr. Dömösi Pál, DSc, egyetemi tanár) Kredit

Térinformatika, amit tudni kell. Márkus Béla

A Gazdálkodás és Szervezéstudományok Doktori Iskola képzési terve

KÖNYVTÁR-INFORMATIKAI KÉPZÉS A KLTE-N

Miskolci Egyetem Gépészmérnöki és Informatikai Kar Alkalmazott Informatikai Tanszék. Dr. Kulcsár Gyula egyetemi docens

NYF-MMFK Műszaki Alapozó és Gépgyártástechnológiai Tanszék mezőgazdasági gépészmérnöki szak III. évfolyam

REGIONÁLIS ÉS KÖRNYEZETI GAZDASÁGTAN MESTERKÉPZÉSI SZAK

MUNKATÁRSI TELJESÍTMÉNY MENEDZSMENT A LOGISZTIKÁBAN

Önálló laboratórium tárgyak

TEXAPP. 3.2 Company Assessment Tool (Hungarian Version) Prepared by: TMTE Contributors: Ecker Gabriella, Deme Gabriella

A vállalti gazdálkodás változásai

Self service reporting fogások, technikák és megoldások controllereknek, nem csak Excel alapon

Információtartalom vázlata

MŰSZAKI MENEDZSER ALAPKÉPZÉSI SZAK. 2. Az alapképzési szakon szerezhető végzettségi szint és a szakképzettség oklevélben szereplő megjelölése:

Így kampányolunk mi. Hans Zoltán. Szolgáltatás Fejlesztés és Online Irányítás vezető. IBM-SPSS üzleti reggeli (Budapest)

LOGISZTIKAI FOLYAMATOK MENEDZSMENTJE

TANTÁRGYI ADATLAP I. TANTÁRGYLEÍRÁS

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Egyetemi szintű Műszaki informatikai szak nappali tagozat (GEMI) (A képzés közös része, szakirányválasztás az 5. félév végén)

S atisztika 1. előadás

Mérnök informatikus (BSc) alapszak levelező tagozat (BIL) / BSc in Engineering Information Technology (Part Time)

Fizikus Analízis 1 ea Meteorológus Analízis 1 ea Tanári Analízis 2 ea. Fizikus Analízis 1 gyak Meteorológus Analízis 1 gyak Tanári Analízis 2 gyak

BIG DATA ELEMZÉSEK LEHETŐSÉGEI

A Projekt portfoliómenedzsment projekt iroda (PMO) alkalmazási feltételei, lehetőségei - szekció bevezető gondolatok

A programozó matematikus szak kredit alapú szakmai tanterve a 2003/2004. tanévtől, felmenő rendszerben

Ellátási Lánc Menedzsment

LOGISZTIKAI KONTROLLING

A benchmarking fogalma

Sikerünk kulcsa: az információ De honnan lesz adatunk? Palaczk Péter

Területi statisztikai elemzések

GAZDÁLKODÁSI ÁS MENEDZSMENT ALAPKÉPZÉSI SZAK SZAKISMERTETŐJE 2014.

SZAKIRÁNYOK A MISKOLCI EGYETEM MÛSZAKI INFORMATIKAI SZAKÁN

Oracle Enterprise Manager: Az első teljesértékű felhő üzemeltetési megoldás

Hardverkarbantartás. szerviz 3% 13% Számítógépes hardver 18%

Vállalatgazdaságtan Intézet. Logisztika és ellátási lánc szakirány Komplex vizsga szóbeli tételei március

Óbudai Egyetem Neumann János Informatikai Kar. Intelligens Mérnöki Rendszerek Intézet

Átírás:

ADATBÁNYÁSZATI MÓDSZEREK OKTATÁSA A SAS RENDSZERREL Kiss Ferenc, hunfek@mvs.sas.com SAS Institute Abstract This paper briefly summarises the core of Data Mining enlighting some application fields and techniques of it. A short list describes scientific and business fields which are regular application areas of the SAS System. These subjects are thought at a lof ot well known universities worldide using SAS as demonstration and/or problem solution tool. Figures demonstrates some analytical capabilities of SAS System. 1. Mi az adatbányászat? A számítógépek a bölcsesség forrását ígérték nekünk, azonban csak az adatok áradatát szállítják írta 1991-ben megjelent könyvében Gregory Piatetsky-Shapiro. E megállapításával arra az alap vetõ tényre világít rá, hogy a kutatási, termelési, üzleti folyamatokból származó adatokat infor mációvá kell alakítani ahhoz, hogy megfelelõ következtetéseket vonhassunk le, és ezek alapján dön téseket hozhassunk. Az adatbányászat lényegét tekintve nem más, mint a nyers adatok halma zából az össze függések, a kulcstényezõk kiemelése. Az alábbi néhány tipikus példa jól mutatja az adat bányászat alkalmazási területeinek sok színûségét: célzott marketing: ügyfél célcsoportok meghatározása; ügyfél elégedettség-vizsgálat: kérdõívekre és demográfiai adatokra alapozva; értékesítési elõrejelzés - korábbi forgalmi adatokra és befolyásoló tényezõkre alapozva; üzemi és ügyviteli folyamatok optimalizálása; hitelkérelem-elbírálás; visszaélés felderítés: biztosítási csalások, hitelkártya visszaélések; befektetési portfólió elemzés, árfolyam-elõrejelzés; beruházás menedzsment; raktárkészlet tervezés és optimalizálás; beszállító és ügyfélminõsítés; számítógépek és hálózatok terhelésének elõrejelzése, feladatütemezés. Az adatbányászati módszerek csak részben új eljárások: például minta keresés adatokban, fel táró jellegû elemzések, elõrejelzések. Támogatják vagy automatizálják a mintakeresési folyamatokat és fõleg nagy adathalmazokra használhatók, ezért nagy adathalmazok kezelésére szolgáló olyan infor matikai technológiák jelenléte elengedhetetlenül szükséges, mint például az adatraktár koncep ció megvalósítása. 701

Döntéshozás támogató rendszerek C/S EIS OO RAD Query Minõség g Kockázat Adat- bányászat Konfirmatív adat- elemzés DSS Visualise Statisztika Jelentések Fogyasztó Termék Piac OLAP++ Jövõ 1. ábra Az adatbányászat az adatraktár kiaknázásának egyik lehetõsége A Gartner Group szerint az adatbányászat az alábbi elemzõ eszköztárak felhasz nálását jelenti: vizualizáció; magasszintû statisztikai módszerek; következtetõ rendszerek; neurális hálózatok. Vizualizáció alatt a két és háromdimenziós grafikonokat, tudományos és üzleti diagramokat, speciális ábrázolásokat, térképek, térin formatikai eszközök valamint multimédia hasz nálatát értik. A 2. ábrán néhány, a vezetõi információs rendszerekben szokásos ábrázolás látható. A statisztikai eljárások között nem csak a szorosan vett matematikai statisztikai módszerek találhatók. Ide tartoznak a statisztikai próbák, klaszter-, faktor-, diszkriminancia analízis, több dimenziós skálázás, lineáris és nemlineáris modellek, kontingenciatáblák, conjoint elemzés, preferencia térképek mellett például az idõsorok elemzése, lineáris és nemlineáris regresszió-analízis, lineáris és nemlineáris programozás, az ökonometriai modellek, és szimulációs és egyéb speciális eljárások. Szintén a Gartner Group elemzésében olvasható és ez az oktatás szempontjából egyáltalán nem mellékes, hogy milyen szempontokat érdemes figyelembe venni egy adatbányászati szoftver értékelésénél. A következõ kérdéseket kell feltenni: mekkora adatméretekkel képes a rendszer dolgozni? képes-e a rendszer a szükséges elõfeldolgozások elvégzésére, vagy ehhez más eszköz kell? "bottom-up" és/vagy "top-down" megközelítést kínál? milyen könnyen frissíthetõk a modellek? használata milyen tudást igényel? van-e lehetõség felhasználói beavatkozásra az elemzés során? 702

Többdimenziós metszetek és tallózás tényezõk 3 típusa Térképek és A kritikus siker- jelzõlámpa- színkódolás Grafika - 3D oszlopok Boston mátrix diagram 2. ábra Néhány SAS üzleti grafikai ábrázolásmód A SAS rendszerben az adatbányászati eszközök teljes skálája megtalálható úgy, hogy mind adathalmazok feldolgozására van optimalizálva. egyikük nagy 2. A SAS rendszerrel oktatható tárgyak és témakörök A SAS rendszert széles körben alkalmazzák oktatási és kutatási célokra a világ mintegy 100 orszá gának egyetemein. Ez részben annak köszönhetõ, hogy a SAS Institute évente bruttó bevé teleinek mintegy 35%-át kutatás-fejlesztésre fordítja, ezáltal a legújabb tudományos és techno lógiai eredmények szinte késedelem nélkül a felhasználók rendelkezésére állnak. Emellett a SAS Institute közremûködésével számos elismert szakkönyv és egyetemi tankönyv jelent meg egyetemi oktatók tollából. A dokumentáció elkészítésekor nagy gondot fordítottunk arra, hogy minden elemzõ eljárásnál képlettel és hivatkozással egyértelmûen azonosítható legyen a módszer, és jellemzõ alkalmazási példákkal mutassuk be azok használatát. A SAS rendszer fejlesztõ eszközeivel oktató és demonstrációs programok is készíthetõk. A SAS rendszer felhasználóinak járó támogatás többek között tartalmaz egy olyan ftp hozzáférést, ahonnan a dokumentáció példáin túl további példaprogramok, esettanulmányok tölthetõk le. 703

3. ábra Egy raktári kiszolgáló rendszer vizsgálata a QSIM diszkrét szimulációs eszközzel A SAS rendszerben található eszközök és eljárások legnagyobb hányada általános célú, paramé terezhetõ, ezáltal a különbözõ szakterületekrõl vett, de azonos logikával mûködõ, illetve azonos matematikai hátterû problémák vizsgálhatók velük. A 3. ábrán egy gyári késztermékraktár logisztikai láncának szimulációs vizsgálatára látható példa. Elemezhetõ, hogy a lánc melyik pontján jöhetnek létre leginkább késések, hol van gyakran szabad kapacitás, milyen átszervezésekkel lehetne optimálisabbá tenni a folyamatot, stb. Ugyanezzel az eszközzel vizsgálhatók és optimalizálhatók olyan sorbanállási és tömeg kiszolgálási modellek és folyamatok is, mint például: a számítógép hálózatok szerverei ki tudják-e szolgálni a felhasználókat adott topológia, teljesít ményparaméterek mellett? termelési folyamatban milyen ütemezésû logisztikai lánc mellett lesz biztonságos a gyártósor kiszolgálása? egy ismert ügyiratkezelési folyamatban hol torlódnak az akták, hol vannak szabad kapacitások, hol vannak ismétlõdõ, párhuzamos folyamatok? ismert erõforrás, probléma eloszlás, populáció és ellátási körzet adatok mellett melyik kórházat (hivatalt, iskolát, üzletet, szolgáltatót) kell bezárni, és melyiket bõvíteni? 704

4. ábra Pontfelhõk háromdimenziós ábrázolása vizuális feltáró elemzéshez a SAS/Spectraview rendszerrel A következõ felsorolás néhány olyan tárgyat és témakört foglal össze a teljesség igénye nélkül, amelyek oktatásánál a SAS rendszer jól alkalmazható mint demonstrációs, vagy mint feladat megoldó eszköz. bank- és pénzügytan pénzügyi számítások, pénzügyi modellek, banki és tõzsdei alkalmazások (pl. hi telminõsítés, árfolyamelõrejelzés, hozamszámítások, likviditásmene dzsment, visszaélés-felderítés, portfoliómenedzsment, kockázatkezelés); diplomatervezés a SAS Institute kidolgozandó diplomaterveket ajánl; informatika adatbázisok menedzselése, adatbázis hozzáférés, SQL, információ tárház, vezetõi információrendszerek, jelen téskészítés, döntéstámogatás, adat vizualizálás, prezentáció, 4GL nyelvek és eszközök, intelligens ügyfél-kiszolgáló rend szerek, számítóközpontok teljesítmény mene dzsmentje, hálózatok opti malizálása, szimuláció, OLAP, RAD, OOAD, multi média, térinformatika, mesterséges intelligencia, programozás, tanuló algoritmusok; ipari folyamatok folyamatszabályozás, sorbanállási problémák vizsgálata, szimuláció, mérési adatok feldolgozása és kiértékelése; kontrolling, számvitel pénzügyi elemzések, jelentések, mutatók, konszolidáció, pénzügyi mo dellek, pénzügyi vezetõi rendszerek, vállalati likviditásmenedzsment, kocká zatkezelés, portfoliómenedzsment; 705

közgazdaságtan mikro- és makrogazdasági modellezés, gazdasági döntések, elemzések, pénzügyi számítások; labor/mérési gyakorlat laboratóriumi elemzések, adatfeldolgozás, adatvizualizáció, dokumentálás; logisztika szállítási feladatok, sorbanállási problémák, tömegkiszolgáló rendszerek, készletmodellek; marketing elõrejelzések, trendszámítás, piackutatás, piacelemzés számítógépes támo gatása, mi lenne ha elemzések, piaci potenciál vizsgálata, szimuláció, ügyfélkifogások elemzése, politikai marketing elemzések; matematika klasszikus és többváltozós, alkalmazott statisztika, operációkutatás, mate matikai programozás (pl. biztosítási matematika, biostatisztika, pénzügyi matematika, döntéstámogatás); menedzsment erõforrás- és projektmenedzsment, humánerõforrás menedzsment, üzleti folyamatok újratervezése (BPR), TQM, vezetõi információrendszerek, dön téstámogatás, ügyfélminõsítés; minõségügy Pareto elemzés, Ishikawa diagram, ellenõrzõ kártyák tervezése és haszná lata, kísérlettervezés, SPC, QC, QI, TQM, LIMS, mérési adatok kiér tékelése; szociológia demográfiai és szociológiai elemzések, adatvizualizáció. 5. ábra Hitelkártya-visszaélések felderítése neurális hálózatokkal 706

6. ábra A SAS/GIS térinformatikai alkalmazása: egy piacszegmentációs esettanulmány 3. Összefoglalás A SAS rendszer széles körben alkalmazható az oktatásban demostrációs és feladatmegoldó eszközként egyaránt. A SAS Institute által nyújtott felhasználói támogatás, valamint a cég fejlesz tések iránti elkötelezettsége biztosítja, hogy a SAS rendszer mindig a legkorszerûbb eszközöket és technológiákat nyújtja használóinak. Ezáltal lehetõséget ad a folyamatosan versenyképes, világ színvonalú oktatás szakmai hátterének fenntartására. 707

Irodalom: Gartner Group: Peak Performance, Gatabase Marketing and Data Mining. March, 1996. Gartner Group: Using Data Mining to Gain Competitive Edge, Part 2. Inside Gartner Group This Week, Aug. 30, 1995. Piatetsky-Shapiro, Gregory: Knowledge Discovery in Databases, AAAI, 1991. SAS Institute White Paper: Data Minng with the SAS System: From Data to Business Advantage. További információk: SAS Institute Magyarországi Képviselet 1122 Budapest, Határõr út 36. Tel: (1) 202-6247, (1) 202-6047 Fax: (1) 202-5847 Internet: web: http://www.sas.com ftp: ftp.sas.com BBS: 00 1 919-677-8155 708