Intelligens elosztott rendszerek

Hasonló dokumentumok
ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer?

Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás.

Tanult nem paraméteres próbák, és hogy milyen probléma megoldására szolgálnak.

s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés

VARIANCIAANALÍZIS (szóráselemzés, ANOVA)

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek!

Bevezetés a hipotézisvizsgálatokba

4 2 lapultsági együttható =

Least Squares becslés

IDA ELŐADÁS I. Bolgár Bence október 17.

Minősítéses mérőrendszerek képességvizsgálata

Konfidencia-intervallumok

OKTATÁSGAZDASÁGTAN. Készítette: Varga Júlia Szakmai felelős: Varga Júlia június

Regresszió. Fő cél: jóslás Történhet:

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Neurális hálózatok. Nem ellenőrzött tanulás. Pataki Béla. BME I.E. 414,

Lineáris regresszió. Statisztika I., 4. alkalom

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

Kísérlettervezés alapfogalmak

Kísérlettervezés alapfogalmak

ELTE TáTK Közgazdaságtudományi Tanszék ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter június

NEVEZETES FOLYTONOS ELOSZLÁSOK

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

Variancia-analízis (ANOVA) Mekkora a tévedés esélye? A tévedés esélye Miért nem csinálunk kétmintás t-próbákat?

Schlüter -KERDI-BOARD. Közvetlenűl burkolható felületű építőlemez, többrétegű vízszigetelés







Adatok statisztikai értékelésének főbb lehetőségei

[Biomatematika 2] Orvosi biometria



A sokaság/minta eloszlásának jellemzése

Statisztikai. Statisztika Sportszervező BSc képzés (levelező tagozat) Témakörök. Statisztikai alapfogalmak. Statisztika fogalma. Statisztika fogalma

Matematikai alapok és valószínőségszámítás. Normál eloszlás

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

10. Alakzatok és minták detektálása

Panel adatok elemzése

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

3D - geometriai modellezés, alakzatrekonstrukció, nyomtatás

ADATREDUKCIÓ I. Középértékek

Digitális Domborzat Modellek (DTM)

Kutatásmódszertan és prezentációkészítés

A valószínűségszámítás elemei

Az α értékének változtatásakor tanulmányozzuk az y-x görbe alakját. 2 ahol K=10

Méréselmélet: 5. előadás,

FORD KA KA_202054_V5_2013_Cover.indd /06/ :59

7. Mágneses szuszceptibilitás mérése

ADATREDUKCIÓ I. Középértékek

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Compton-effektus. Zsigmond Anna. jegyzıkönyv. Fizika BSc III.

2. A 2016.évi Országos kompetencia mérés eredményeinek feldolgozása

A konfidencia intervallum képlete: x± t( α /2, df )

A PAKSI ATOMERŐMŰ KÖRNYEZETI DÓZISADATAINAK ANALÍZISE

Adatelemzés és adatbányászat MSc

Táblázatok 4/5. C: t-próbát alkalmazunk és mivel a t-statisztika értéke 3, ezért mind a 10%-os, mind. elutasítjuk a nullhipotézist.

14 A Black-Scholes-Merton modell. Options, Futures, and Other Derivatives, 8th Edition, Copyright John C. Hull

KÖVETKEZTETŐ STATISZTIKA

Statisztika feladatok

Összegzés a 92/2011.(XII.30.) NFM rendelet 9. melléklete alapján

Al-Mg-Si háromalkotós egyensúlyi fázisdiagram közelítő számítása

10. Mintavételi tervek minısítéses ellenırzéshez

Normális eloszlás paramétereire vonatkozó próbák

Intelligens Rendszerek Elmélete

Balogh Edina Árapasztó tározók működésének kockázatalapú elemzése PhD értekezés Témavezető: Dr. Koncsos László egyetemi tanár

STATISZTIKA. ( x) 2. Eloszlásf. 9. gyakorlat. Konfidencia intervallumok. átlag. 45% 40% 35% 30% 25% 20% 15% 10% 5% 0% (cm)

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Poisson-eloszlás Exponenciális és normális eloszlás (házi feladatok)

OLS regresszió - ismétlés Mikroökonometria, 1. hét Bíró Anikó A tantárgy tartalma

Gépészmérnöki alapszak, Mérnöki fizika 2. ZH, december 05. Feladatok (maximum 3x6 pont=18 pont)

Extrém-érték elemzés. Extrém-érték eloszlások. Megjegyzések. A normálhatóság feltétele. Extrém-érték modellezés

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

II. Rákóczi Ferenc Kárpátaljai Magyar Fıiskola. Pataki Gábor. STATISZTIKA I. Jegyzet

IBNR számítási módszerek áttekintése

Extrém-érték elemzés. Extrém-érték eloszlások. A normálhatóság feltétele. Megjegyzések. Extrém-érték modellezés

Fázisátalakulások vizsgálata

Optikai elmozdulás érzékelő illesztése STMF4 mikrovezérlőhöz és robot helyzetérzékelése. Szakdolgozat

Iskolai jelentés. 10. évfolyam szövegértés

Minta 2. MATEMATIKA KÖZÉPSZINTŰ ÍRÁSBELI FELADATSOR. I. rész

METROLÓGIA ÉS HIBASZÁMíTÁS

Matematikai statisztika

TÉRBELI STATISZTIKAI VIZSGÁLATOK, ÁTLAGOS JELLEMZŐK ÉS TENDENCIÁK MAGYARORSZÁGON. Bihari Zita, OMSZ Éghajlati Elemző Osztály OMSZ

} számtani sorozat első tagja és differenciája is 4. Adja meg a sorozat 26. tagját! A = { } 1 pont. B = { } 1 pont. x =

kompetenciakompetenciakompetenci akompetenciakompetenciakompeten ciakompetenciakompetenciakompete nciakompetenciakompetenciakompet

Laboratóriumi kontrollkártya használata Tananyag. Készítette: Muránszky Géza vegyészmérnök Oktató: Lőrinc Anna minőségirányítási előadó

7. Regisztráció. Kató Zoltán. Képfeldolgozás és Számítógépes Grafika tanszék SZTE (

A multikritériumos elemzés célja, alkalmazási területe, adat-transzformációs eljárások, az osztályozási eljárások lényege

Közlemény. Biostatisztika és informatika alapjai. Alapsokaság és minta

Intelligens adatelemzés ea. vázlat 1. rész

2 Wigner Fizikai Kutatóintézet augusztus / 17

,...,q 3N és 3N impulzuskoordinátával: p 1,

Ideális gáz és reális gázok

Jövedelem és szubjektív jóllét: az elemzési módszer megválasztásának hatása a levonható következtetésekre

Átírás:

Intellgens elosztott rendszerek VIMIAC2 Adatelőkészítés: hhetőségvzsgálat normálás stb. Patak Béla BME I.E. 414, 463-26-79 atak@mt.bme.hu, htt://www.mt.bme.hu/general/staff/atak

Valamlyen dőben állandó, esetleg lassan vagy gyorsan változó folyamat, jelenség árfolyam tanulmány kredt hőmérséklet Szenzor1 Szenzor1 SzenzorK Lokáls Lokáls Lokáls ntell- ntell- ntellgenca genca genca Közont feldolgozás közont ntellgenca

Sokszor nem ka kellő hangsúlyt az adatok előfeldolgozása Tkus eljárások: 1. Hhetőségvzsgálat 2. Klógó adatok detektálása, törlése 3. Adatótlás 4. Normálás stb.

Szenzor1: A megfgyelt ember magassága 199 cm Szenzor2: A megfgyelt ember tömege 89 kg Szenzor3: A megfgyelt ember tömege egy na alatt 18,2 kg-t nőtt Szenzor4: A megfgyelt ember magassága 195 cm Szenzor5: A megfgyelt ember tömege 6 kg Szenzor6: A megfgyelt ember magassága 275 cm Szenzor7: A megfgyelt ember magassága 197 cm Szenzor8: A megfgyelt ember magassága 189 cm Szenzor9: A megfgyelt ember tömege egy na alatt,7 kg-t csökkent

Hhetőségvzsgálat: 1. Tudnunk kell valamt a jelenkről (a ror nformácó l. az emberek magasságának, tömegének alsó és felső korláta a magasság és a tömeg szokásos összefüggése, a lehetséges eltérés mértéke 2. A mért jelenkből levonunk következtetést a szokásos lmtekről, összefüggésekről (m a tkus, m a klógó adat? ha sok adatot mérünk, akkor kereshetünk tkus csoortokat (klasztereket, lmteket, összefüggéseket az adatokban

Normálás: A normálás sokszor nagymértékben gyorsítja, ontosabbá, esetenként lehetővé tesz a feldolgozást Demóélda: olnomáls regresszó y nose 2 3 1 2 3 5, 1, 2, 3 olyft (, y,3-5.1.2.3.4.5.6.7.8.9 1 5-5 1 1 1 1 1 1.1 1.1 1.1 1.1 1.1 1.1 1 4, 1, 2, 3 olyft (1, y,3

y ( ( ( nose 2 3 1 2 3 először (,1 másodszor (1.,1.1 1. Valód értékek = 1 =-1 P 2 =189 3 =-2 Becsült - ϵ (,1-ben -,68-1,29 189,7-2,56 Becsült - ϵ (1,11 19.538-58.613.481.99 5.861.166-195.37 Warnng: Polynomal s badly condtoned. Add onts wth dstnct X values, reduce the degree of the olynomal, or try centerng and scalng as descrbed n HELP POLYFIT.

Ugyanez a demóélda neuronhálós tanítással (eltolás nélkül = a 2. eochnál ér el a legjobb közelítést,,1212 MSE

Eltolással =1. A 35. eochnál ér el a legjobb közelítést, 1,8199 MSE Több mnt egy nagyságrenddel rosszabb közelítés! (Egyes esetekben ennél lényegesen lassabb futást s taasztalhatunk, sokkal rosszabb végeredménnyel!

Egyszerű normálás eljárások } mn{ } ma{ } mn{ ~ ( ( ( ( ( P P 1 ( 1 P P 1 2 ( 2 ( 1 1 ˆ ˆ ~ ( ( Nulla várhatóértékűre és egységny szórásúra normálás (skalár komonensenként eset [,1] tartományra normálás

A aramétervektor skalár komonensenek együttes normálása C Cφ j 1 P P 1 1 P P 1 1 φ j j ( ( ( ( φ1 φ2... φn ( dag 1 2 N T ~ ( 1/ 2 T ( ( ( nulla várhatóértékű és kovarancamátra egységmátr

Klógó (outler adatok detektálása A klógó adatok erősen meghamsíthatják a tanítás eredményét 3 2 1-1.1.2.3.4.5.6.7.8.9 1 8 6 4 2-2.1.2.3.4.5.6.7.8.9 1 zöld: gaz görbe, fekete: a neuronháló által tanult modell Az alsó ábrán 3 erősen klógó (outler adatont matt torzított a tanítás eredménye (a több ont, lletve a háló mérete azonos

Klógó (outler adatok detektálása 1. Az adatok szórását felhasználva Adatmodellünk: az adat egy átlagos érték körül szór, és mnél távolabb van az átlagtól, annál kevésbé valószínű, hogy reáls (nem klógó emberek magassága, bankszámlabetét, vagy énz kvétel, elektromos fogyasztás stb. Normáls ( átlagú, várható értékű, egységny szórású Gauss P(<16% P(2< 2,3% P(3<,14% P(4<,3% - l.

Az adatok szórását felhasználva Példa: adatsorunknál (1 adat az átlagtól több mnt 4-val eltérő adatot klógónak mnősítjük. N adatszám átlag szórás klógó adat lmt 1 29,7 4,85 49,1 7 6 5 4 3 2 1 1 15 2 25 3 35 4 45 Jön még két adat (2 klógó: X(11=66 X(12=1 N adatszám átlag szórás klógó adat lmt 1+2 3,7 9,17!!! 67.4 1 8 6 4 2 1 2 3 4 5 6 7 8 9 1

N/4 adat Paraméterérték N/4 adat 2. Az adatok sorrendezését felhasználva (Order statstc flterng Outlerek UOF = Q3 + 3 * IQ 13 11 9 7 N/4 adat N/4 adat Q3 Q2=medán Q1 IQ=Q3-Q1 Az adatok közéső (tkus fele 5 3 15

Az adatok sorrendezését felhasználva Ugyanaz a élda, mnt az előbb: 1 adat, majd lusz kettő; 66 és 1: N 1 Q1 Q2 Q3 Q4 26,7 29,9 32,4 41,1 IQ 5,6 49,2 Q3+3*IQ 7 6 5 4 3 2 1 adatok Q1 körül: 26.55, 26.74, 26.75 1 15 2 25 3 35 4 45 adatok Q3 körül: 32.22, 32.36, 32.58 N Q1 Q2 Q3 Q4 IQ Q3+3*IQ 1 8 6 4 Q1 Q3 12 26,8 29,9 32,6 1 5,8 5,1 2 1 2 3 4 5 6 7 8 9 1

Hányos, hbás adatok, adatótlás Mvel mndg kevés az adat: ha hányzk egyk-másk komonense, rendszernt akkor sem ér meg eldobn, jobb ótoln a hányt. Ennek alkalmas eszköze lehet a klaszterezés, csoortok keresése a mért adatok közt. Demóélda: Két araméterrel jellemezzük a mntánkat: Egyes mntáknak hányzk az egyk komonense (vagy annyra torz, hogy nem vesszük fgyelembe. Például az n-dk mnta másodk aramétere hányzk: n n1? k k1 k 2

A kétdmenzós adathalmaz eloszlása 1 2

n-dk mnta: n1 =, de hányzk az n2 araméter. Nézzük meg, melyk n2 legvalószínűbb értéke az 2 eloszlás alaján:.2 X2 eloszlása a teljes mntahalmazon -> 2 legvalószínűbb értéke -4.18.16.14.12.1.8.6.4.2-1 -8-6 -4-2 2 4 6 8 1 1 Az 1=-hoz tartozó mnta valószínűleg a 3-as klaszterbe tartozk! -> ma. valószínűségel 2=3 5 2. klaszter 1. klaszter 3. klaszter 1-5 -1-1 -8-6 -4-2 2 4 6 8 1

Másodk demóélda Eredet ké 2%-ban hbás elek (1-1 színkomonens elveszett 5 1 15 2 25 3 35 4 5 1 15 2 25 3

Balról-jobbra: a hbás ké, a globáls araméterekkel javított és a klaszterezett, majd klaszterenként araméterekkel javított 2%-ban hbás elek (1-1 színkomonens elveszett 5 5 5 1 1 1 15 15 15 2 2 2 25 3 35 4 25 3 35 4 25 3 35 4 5 1 15 2 25 3 5 1 15 2 25 3 5 1 15 2 25 3