Mesterséges Intelligencia MI
|
|
- Klára Borosné
- 6 évvel ezelőtt
- Látták:
Átírás
1 Mesterséges Intelligencia MI Egyszerű döntés. Tanuljuk meg! Optimalizáljuk! (itt =metsszük vissza) Pataki Béla (Hullám Gábor) BME I.E. 414,
2 A következőkben olyan módszereket vizsgálunk, amikor minták, mintapéldák alapján akarjuk kialakítani a döntési rendszerünket. Nagyon gyakran a számítógép tanulásához rendelkezésünkre áll egy csomó mintapélda, és ez hordozza az információt. Nincsenek előre kialakított szabályaink a feladatra, csak a mintáink. Persze ilyenkor is valamilyen struktúrában igyekszünk felhasználni a minták hordozta tudást. Tehát a módszerünk az, hogy hogyan használjuk fel a mintákat bizonyos mértékben problémafüggetlen. A hétköznapi életben nagyon gyakori a minta alapján való tanulás, míg a klasszikus (számítógépes) megoldásokban a humán fejlesztő szabályokat alkotott, és ezeket programozta be.
3 Egy algoritmust, pl. egy döntést (ágensfüggvényt) alapvetően két módon lehet megvalósítani? (1) Analitikus tervezés: Begyűjteni az analitikus (fizikai, kémiai stb. összefüggésekből felépített) modelleket az adott problémára. Megtervezni analitikusan a konkrét mechanizmust, és azt algoritmusként implementálni. (2) Tanulás: Megtervezni a tanulás mechanizmusát, és azt algoritmusként implementálni. Majd alkalmazásával megtanulni vele a minták alapján a döntés tényleges mechanizmusát, és azt algoritmusként implementálni. A következőkben a (2)-vel foglalkozunk
4 Tanulás alapvető fajtái: felügyelt tanulás egy esetnél mind a bemenetet, mind a kimenetet észlelni tudjuk (bemeneti minta + kívánt válasz) megerősítéses tanulás az ágens az általa végrehajtott tevékenység csak bizonyos értékelését kapja meg, esetleg nem is minden lépésben (jutalom, büntetés, megerősítés) felügyelet nélküli tanulás semmilyen információ sem áll rendelkezésünkre a helyes kimenetről (az észlelések közötti összefüggések tanulása) féligellenőrzött tanulás a tanításra használt esetek egy részénél mind a bemenetet, mind a kimenetet észlelni tudjuk (bemeneti minta + kívánt válasz), a másik tipikusan nagyobb részénél csak a bemeneti leírás ismert
5 Felügyelt tanulás (pl. induktív következtetés): tanulási példa: (x, f(x)) adatpár, ahol f(x) ismeretlen tanulás célja: f(x) értelmes közelítése egy h(x) hipotézissel h(x) = f(x), x ismert példákon gyakran teljes pontosság h(x') f(x'), x' a tanulás közben még nem látott esetek (általánosító képesség) Valóság, tény f (x) Összehasonlítás x h(x) (hibakritérium)m Hipotézis, modell ló x Tanítás: közelíteni akarjuk h(x)-et f (x)-hez, ilyen irányban javítjuk h(x)-et Feladat: az ismeretlen f-re vonatkozó példák egy halmaza alapján (tanítóhalmaz), adjon meg egy olyan h függvényt (hipotézist), amely tulajdonságaiban jól közelíti az f-et (amit teszthalmazon verifikálunk).
6 Sokféle tanítható eszközt kitaláltak: neurális hálók Bayes-hálók kernelgépek döntési fák legközelebbi szomszéd osztályozók stb. stb. A következőkben először a döntési fákkal foglalkozunk működésük az emberi gondolkodás számára jóval jobban áttekinthető, mint pl. a mesterséges neurális hálóké. (white box black box) Vannak regressziós döntési fák is, de mi az osztályozással foglalkozunk.
7 Példaprobléma: döntés, hogy egy adott étteremben várjunk-e asztalra. Cél: előállítani a döntés logikai függvényét Kvíz következik A problémát tulajdonságokkal vagy attribútumokkal jellemezzük. 1. Alternatíva: van-e a környéken más megfelelő étterem. (I/N) 2. Bár: van-e az étteremben kényelmes bár, ahol várhatunk. (I/N) 3. Pén/Szom: igaz pénteken- és szombatonként. (I/N) 4. Éhes: éhesek vagyunk-e. (I/N) 5. Kuncsaft: hányan vannak már benn (Senki, Néhány és Tele). 6. Ár: mennyire drága (Olcsó, Közepes, Drága) 7. Eső: esik-e kint (I/N) 8. Foglalás: foglalni kell-e előzetesen az asztalt (I/N) 9. Típus: az étterem típusa (Francia, Olasz, Thai v. Burger) 10. BecsültVár: a pincér által bemondott várakozási idő (0-10 perc, 10-30, 30-60, >60 perc) A döntés eredményét a döntési ágensfüggvény adja meg: VárniFog = f(alternativa, Bár, Pén/Szom, Éhes, Kuncsaft, Ár, Eső, Foglalás, Típus, BecsültVár, )
8 5.1 Kvíz Összesen hányféle függvény VárniFog = f (Alternatíva, Bár,., Típus, BecsültVár) lehetséges az előzőleg bemutatott bemeneti és kimeneti attribútumokkal leírható étteremválasztás problémában? A. Kb. 10^4 B. Kb. 10^100 C. Kb. 10^700 D. Kb. 10^2800
9 Az eddigi kiruccanásaink tapasztalata - tanítóminták Pl. Attribútumok Cél Altern Bár Pént Éhes Kuncs Ár Eső Fogl Típus Becs VárniFog X 1 Igen Nem Nem Igen Néhány Drága Nem Igen Francia 0 10 Igen X 2 Igen Nem Nem Igen Tele Olcsó Nem Nem Thai Nem X 3 Nem Igen Nem Nem Néhány Olcsó Nem Nem Burger 0 10 Igen X 4 Igen Nem Igen Igen Tele Olcsó Nem Nem Thai Igen X 5 Igen Nem Igen Nem Tele Drága Nem Igen Francia >60 Nem X 6 Nem Igen Nem Igen Néhány Közep Igen Igen Olasz 0 10 Igen X 7 Nem Igen Nem Nem Senki Olcsó Igen Nem Burger 0 10 Nem X 8 Nem Nem Nem Igen Néhány Közep Igen Igen Thai 0 10 Igen X 9 Nem Igen Igen Nem Tele Olcsó Igen Nem Burger >60 Nem X 10 Igen Igen Igen Igen Tele Drága Nem Igen Olasz Nem X 11 Nem Nem Nem Nem Senki Olcsó Nem Nem Thai 0 10 Nem X 12 Igen Igen Igen Igen Tele Olcsó Nem Nem Burger Igen Mi benne a viselkedésünk mintája? Van-e egyáltalán egy konzisztens - minden tanítópéldának megfelelő viselkedési mintánk? (9216 lehetséges példa van, 12 alapján tanulunk)
10 Döntési fák tanulása döntési fa = egy logikai függvény bemenete: egy tulajdonsághalmazzal leírt objektum vagy szituáció kimenete: egy igen/nem döntés/cselekvés" belső csomópont = valamelyik tulajdonság tesztje él = a teszt lehetséges értéke levél = logikai érték, amelyet akkor kell kiadni, ha ezt a levelet elértük Nem
11 Egy konkrét eset: Kuncsaft = Tele és Éhes és Típus = Olasz Nem VárniFog = (Kuncsaft = Néhány) V ((Kuncsaft = Tele) Éhes (Típus = Thai) Pént/Szomb) V ((Kuncsaft = Tele) Éhes (Típus = Burger))
12 Döntési fák kifejezőképessége teljes - minden (ítélet)logikai függvény felírható döntési faként. (az igazságtábla minden sora = a fa egy bejárása, de így az igazságtábla mérete = a fa mérete = exponenciális!) Döntési fák kialakítása példák alapján példa: (attribútumok értékei, célpredikátum értéke) példa besorolása: a célpredikátum értéke pozitív/negatív példa: a célpredikátum értéke igaz / hamis tanító halmaz: a teljes példahalmaz
13 triviális fa, könnyű - mindegyik példához egy önálló bejárási út a levél a példa besorolását adja. a fa egyszerűen memorizálja a példát, nem alakít ki jellegzetes mintákat a példákból nem általánosít (nem tud ismeretlen példákra extrapolálni) igazi fa - a jellegzetes minták kinyerése, a módszer képes nagyszámú esetet tömör formában leírni, és így az egyelőre ismeretlen példákra is általánosítani
14 A döntési fa építése általános jelenségek Van néhány pozitív és néhány negatív példánk. Heurisztika: válasszuk azt az attribútumot, amelyik a legjobban szétválasztja őket. (mohó!) Ha az összes megmaradt eset pozitív, (vagy az összes negatív), akkor készen vagyunk azzal az ággal: a válasz Igen vagy Nem.
15 A döntési fa építése általános jelenségek Ha csak ezek a példáink lennének: Ha nem maradt egyetlen példa sem, ez azt jelenti, hogy ilyen példát nem figyeltünk meg eddig., de a jövőben mégis jelentkezhet. Ilyenkor valamilyen alapértéket adunk vissza, amelyet rendszerint a csomópont szülőjének többségi válaszából származtatunk.?
16 A döntési fa építése általános jelenségek Ha csak ez az egyetlen attribútum lenne: Nem maradt már teszteletlen attribútum, de maradtak még pozitív és negatív példák. Baj van. Ezeknek a példáknak pontosan megegyezik a leírása, de különböző a besorolásuk. Néhány adat tehát nem korrekt: a zaj torzítja az adatokat vagy hiányzik még attribútum (infó). Megoldás? Pl. a többségi szavazás használata.
17 Döntési fák kialakítása példák alapján példa: (attribútumok értékei, célpredikátum értéke) példa besorolása: a célpredikátum értéke pozitív/negatív példa: a célpredikátum értéke igaz / hamis tanító halmaz: a teljes példahalmaz A legkisebb döntési fa megtalálása - általánosságban nem megoldható Heurisztika: mohóság - egy meglehetősen egyszerű (jó) fa is jó lesz! Az alapötlet: először a legfontosabb attribútumot teszteljük. legfontosabb" = a legnagyobb eltérést okozza példák besorolásában Elvárás: kisszámú példa alapján korrekt besoroláshoz jussunk: a bejárási utak rövidek legyenek, és így az egész fa kicsi (tömör) legyen.
18 Döntési fák kialakítása példák alapján A tökéletes attribútum a példákat két csoportra bontja, az egyikbe csak pozitív, a másikba csak negatív példák tartoznak. Ezzel be is lehetne fejezni a fa tanítását de tökéletes attribútum általában nincs! Olyan attribútumot válasszunk, amely a lehető legmesszebbre jut a pontos besorolás biztosításában.
19 A Kuncsaft attribútum nem tökéletes, de elég jó. Ha a Kuncsaft tesztelése után döntünk, várhatóan legfeljebb 2-t hibázunk a 12 példából. A Típus attribútum ehhez képest? (vacak ) Ha a Típus tesztelése után döntünk, várhatóan 6-ot hibázunk a 12 példából. Éppúgy, mint a teszt előtt! NEM IGEN Egy nagymértékben haszontalan attribútum, mint pl. a Típus olyan példahalmazokat hoz létre, amelyek nagyjából ugyanolyan arányban tartalmaznak pozitív és negatív példákat, mint az eredeti halmaz.
20 Elég jó?" Nagymértékben haszontalan? Kvíz következik A mérték legyen maximális: a tökéletes attribútumra, minimális: olyan attribútumra, aminek egyáltalán nincs értéke számunkra. Egy megfelelő mérték: egy helyzetben az információszükségletünk a helyes megoldáshoz, az attribútum által adott információ várható értéke, információ átlagos tartalma, entrópia, Ha a lehetséges v j válaszok valószínűsége P(v j ), akkor az adott kiinduló halmaz esetén a jó döntéshez szükséges információszükséglet: Teszt(v) I( P( ), P( ),..., P( )) P( ) log P( ) 1 2 k j 2 j j1 k v 1 P(v 1 ) P(v k ) v j v k
21 5.2 Kvíz Melyik esetben nagyobb a helyes válaszhoz szükséges információszükségletünk? A. Ha egy szabályos pénzérme feldobásánál szeretnénk megjósolni, hogy fej lesz vagy írás B. Ha egy hiánytalan franciakártya-csomagnál azt szeretnénk megjósolni, hogy a legfelső lap pikk/treff/kőr/káró C. Ha egy sakk-készlet első bábuját kihúzzuk egy átlátszatlan zacskóból, és azt szeretnénk megjósolni, hogy gyalog lesz-e D. Ha azt szeretnénk megjósolni, hogy jövő évben az MI tárgyra feliratkozó hallgatók közül a névsorban 100-dik fiú vagy lány?
22 pl. Fogadunk 1000 Ft-ba egy szabályos pénzérme dobása esetén, hogy fej jön ki. Mennyit ér nekünk az infó, ha valaki elárulja, hogy melyik fog kijönni? Mennyi infóra van szükségünk? Mennyit ér az infó, ha tudjuk, hogy az érme aszimmetrikus, és 80%-ban fej jön ki? Mennyit ér nekünk az infó, ha az érme mindkét oldalán fej van, tehát 100%-ban ez jön ki? I(p1,1-p1) 0.8 I(p1,1-p1) p1
23 A döntési fa információtartalma - a tanítóhalmazban található pozitív és negatív példák aránya alapján A tanítóhalmaz p pozitív és n negatív példát tartalmaz. A két válasz: v 1 (pozitív), v 2 (negatív), és a valószínűségük becslése: p n P1, P2 p n p n Ekkor a fa információtartalmának becslése: p n p p n n I( P( 1), P( 2)) I, log2 log2 p n p n p n p n p n p n Hogyan válasszuk ki, hogy melyik attribútumot teszteljük? Mennyi új információt ad nekünk egy attribútum tesztelése? Mennyi információra volt szükségünk az attribútum tesztelése előtt, és mennyire van még szükségünk az attribútum tesztelése után? A kettő különbségét nyertük meg a teszttel!
24 Bármelyik A attribútum az E tanító halmazt E 1,E 2,,E N részhalmazokra bontja az A tesztjére adott válaszoknak megfelelően, ha A tesztje N különböző választ ad. A p, n Nyereség(A) é 1 é k é N I(teljes fa) I(részfa k ) Maradék(A) = k súly(részfa k ) I(részfa k ) p 1, n 1 p k, n k p N, n N # példa(részfa k ) súly(részfa k ) = # példa(fa)
25 Hogyan válasszunk attribútumot? N pk n k pk n k Maradék( A) I, k 1 p n pk nk pk nk Az attribútum tesztjének információnyeresége az eredeti információigény és a teszt utáni új információigény különbsége: p n Nyereség( A) I, Maradék( A) p n p n Válasszuk a pillanatnyilag legnagyobb nyereséget adó attribútumot! (Mohó eljárás)
26 Közbevetés: mi az információszükséglet, ha 100%-os az egyik (és 0%-os a másik) eset? I(0,1) =? log 2 () helyett használhatunk ln()-t, hiszen csak egy konstanssal való szorzásban különböznek: log 2 (x)= log 2 (e).ln(x) 0ln(0) lim x0 ln( x) 1/ x helyette a deriváltak hányadosa vizsgálható (l Hopital szabály) ln( x) 1/ x 0ln(0) lim x 0 = lim x 0 lim 2 x 0( x) 0 1/ x 1/ x
27 Nézzük meg a Kuncsaft és a Típus attribútumokat Nyereség( Kuncsaft) 1 I(0,1) I(0,1) I(, ) 0,54 bit Nyereség( Típus) 1 I(, ) I(, ) I(, ) I(, ) 0 bit Több attribútumra is kellene a számítás, de a Kuncsaft kimagaslóan jó.
28 (Kuncsaft = Tele) ágon még fennmaradó példák Példák Attribútumok Cél Altern Bár Pént Éhes Ár Eső Fogl Típus Becs VárniFog X 2 Igen Nem Nem Igen Olcsó Nem Nem Thai Nem X 5 Igen Nem Igen Nem Drága Nem Igen Francia >60 Nem X 9 Nem Igen Igen Nem Olcsó Igen Nem Burger >60 Nem X 10 Igen Igen Igen Igen Drága Nem Igen Olasz Nem X 4 Igen Nem Igen Igen Olcsó Nem Nem Thai Igen X 12 Igen Igen Igen Igen Olcsó Nem Nem Burger Igen Részfában: p 1 = 2, n 1 = 4, p 1 /(p 1 +n 1 ) = 1/3, n 1 /(p 1 +n 1 ) = 2/3
29 (Kuncsaft = Tele) ág I = I(részfa) = I(2/6, 4/6) =.9183 (2 pozitív és 4 negatív példa) Ha pl. Alternatíva-t teszteljük, akkor a nyereség: Ny(Altern) = I [5/6 I(2/5, 3/5) + 1/6 I(0, 1)] Altern = Igen Altern = Nem p2 = 2, p3 = 0 n2 = 3 n3 = 1 6 példa Ny(Altern) = I [5/6 I(2/5, 3/5) + 1/6 I(0, 1)] =
30 (Kuncsaft = Tele) ág Ny(Altern) = I [5/6 I(2/5, 3/5) + 1/6 I(0,1)] = Ny(Bár) = I [1/2 I(1/3, 2/3) + 1/2 I(1/3, 2/3)] = = 0 Ny(Péntek) = I [5/6 I(2/5, 3/5) + 1/6 I(0,1)] = Ny(Éhes) = I [4/6 I(1/2, 1/2) + 2/6 I(0,1)] = Válasszuk pl. ezt! Ny(Ár) = I [4/6 I(1/2, 1/2) + 2/6 I(0,1)] = Ny(Eső) = I [5/6 I(2/5, 3/5) + 1/6 I(0,1)] = Ny(Foglalt) = I [2/6 I(0,1) + 4/6 I(1/2,1/2)] = Ny(Típus) = I [2/6 I(1/2, 1/2) + 1/6 I(0,1) + 2/6 I(1/2, 1/2) + 1/6 I(0,1)] = Ny(Becs) = I [2/6 I(1/2, 1/2) + 2/6 I(0,1) + 2/6 I(1/2, 1/2)] =
31 (Kuncsaft = Tele) ÉS Teszt(Éhes?)
32 (Kuncsaft = Tele) ÉS (Éhes?=Igen) ágon még fennmaradó példák Példa Attribútumok Cél Alt Bár Pént Ár Eső Fogl Típus Becs VárniFog X 2 Igen Nem Nem Olcsó Nem Nem Thai Nem X 10 Igen Igen Igen Drága Nem Igen Olasz Nem X 4 Igen Nem Igen Olcsó Nem Nem Thai Igen X 12 Igen Igen Igen Olcsó Nem Nem Burger Igen Részfában: p 1 = 2, n 1 = 2, p 1 /(p 1 +n 1 ) = ½, n 1 /(p 1 +n 1 ) = ½ Információszükséglet a következő teszt előtt ezen az ágon: 1 bit!
33 Különböző attribútumok nyeresége a (Kuncsaft = Tele) ÉS (Éhes?=Igen) Ny(Alt) = I [1/1 I(1/2, 1/2) + 0] = 1-1 = 0 Ny(Bár) = I [1/2 I(1/2, 1/2) + 1/2 I(1/2, 1/2)] = 1-1 = 0 Ny(Péntek) = I [1/4 I(0,1) + 3/4 I(1/3,2/3)] = Ny(Ár) = I [1/4 I(0,1) + 3/4 I(1/3,2/3)] = Ny(Eső) = I [1/1 I(1/2, 1/2) + 0] = 1-1 = 0 Ny(Foglalt) = I [1/4 I(0,1) + 3/4 I(1/3,2/3)] = Ny(Típus) = I [1/4 I(0,1) + 1/4 I(0,1) + 1/2 I(1/2, 1/2)] =.5 Válasszuk pl. ezt! Ny(Becs) = I [1/2 I(1/2, 1/2) + 1/2 I(1/2, 1/2)] = 1-1 = 0
34 (Kuncsaft = Tele) ÉS (Éhes?=Igen) ÉS (Típus = Thai) ágon még fennmaradó példák Példa Attribútumok Cél Alt Bár Pént/Szo Ár Eső Fogl Becs VárniFog X 2 Igen Nem Nem Olcsó Nem Nem Nem X 4 Igen Nem Igen Olcsó Nem Nem Igen A többi nem jó jellemző Részfában: p 1 = 1, n 1 = 1, p 1 /(p 1 +n 1 ) = 1/2, n 1 /(p 1 +n 1 ) = 1/2 És ez ugyanúgy marad pl. a Bár = Nem, vagy Eső = Nem, vagy Ár = Olcsó, stb. mentén (azaz ezekbe az irányokba nem érdemes építeni a fát).
35 A kialakított döntési fa Ha pl. a Pént/Szomb helyett a Becs attribútumot választjuk ugyanúgy konzisztens a kialakuló fa mindegyik példánkkal, DE máshogy általánosít! Nem
36 Kvíz következik
37 6.1. Kvíz A leíró attribútumok közt van egy, amelyik minden mintára egyedi (pl. a TAJ szám az embereknél). Melyik állítás nem igaz a következők közül? A. A mohó algoritmusunk szinte biztosan ezt fogja választani tesztelendőnek, mert mindegyik gyermekcsomópont homogén B. Ennek a tesztelése értéktelen, mert ha teszteljük, akkor a kialakult fának nem lesz általánosító képessége (új mintákra nem ad választ) C. Nem baj, ha ezt teszteljük, mert a későbbi tesztek majd helyrehozzák az esetleges problémákat D. Érdemes gyanakodni, ha egy attribútum tesztje nagyon sokféle kimenettel rendelkezik, mert könnyen kialakulhatnak homogén gyermekcsomópontok
38 A mintákat torzító zaj hatása túltanulást okozhat! (a faék egyszerűségű gondolkodás dicsérete! ) 400 Population of the U.S Population of the U.S Millions harmadfokú polinom közelítés data degree = 1 degree = 2 degree = 3 degree = 4 degree = 5 degree = 6 degree = 7 degree = Millions Matlab demó: az közti népszámlálási adatokból becsüljük 2010-es USA népességet. (Regressziós feladat, de a jelenség a döntéseknél hasonló hatást okoz.) A nagyon okos = túl komplex eszköz a zajt is megtanulja, rosszabbul becsül, mint az egyszerűbb!
39 A döntési fa hibája Mikor álljunk le a döntési fa növesztésével? Alapvetően 2 stratégia: 1. Korai leállás Túltanulás! (Már a zajt tanulja, ami eltér a tanító és a tesztmintákon.) teszthalmazon mérve tanítóhalmazon mérve A döntési fa leveleinek száma Ahogy növesztjük a fát, egyre több levele van. (A levelekkel mérhetjük, hogy mekkorára nőtt a fa, mennyire komplex.)
40 Döntési fa nyesése (pruning): (1) Beállított max. mélység (mint a mélységkorlátozott keresésnél), ha elérjük, akkor ezen a szinten mindenképpen leállunk, nem fejtjük ki tovább az adott ágat. (2) Vizsgáljuk meg az elvégzett teszteket, ismerjük fel a nem releváns (semmitmondó) felhasznált attribútumot, és az adott ágat ott fejezzük be (metsszük vissza a fát).
41 Döntési fa nyesése 2. Engedjük túlnőni, majd visszavágjuk, visszanyessük Első lehetőség Ismerjük fel ha nem releváns attribútumot használtunk, és az adott ágat ne fejtsük ki tovább, sőt messük le a kialakított részfát. Irreleváns attribútum: példahalmaz kettévágásánál a kapott részhalmazok kb. azonos arányban tartalmaznak pozitív és negatív példát, mint az eredeti halmaz. Az információ nyereség ilyenkor közel 0. Az információ nyereség hiánya az irrelevancia jó jelzése. Milyen nagy legyen az információ nyereség, hogy egy attribútumot mégis felhasználjunk a példahalmaz megosztására? Statisztikai tesztet végzünk: feltesszük, hogy nincs jellegzetes minta = ún. nulla hipotézis.
42 Statisztikai teszt fordítva gondolkodunk, feltesszük, hogy nincs a halmazban jellegzetes minta = ún. nulla hipotézis. Utána ezt megpróbáljuk cáfolni vagy legalább belátni,hogy nagyon valószínűtlen! Ha a nullhipotézis igaz, akkor elvileg 0 lenne az információnyereség, az ettől való eltérés csak a véletlen műve. Ha az eltérés nagy (jóval nagyobb, mint 0) nem valószínű, hogy az észlelt eltérés véletlen ingadozásból következik a nulla hipotézis nem valószínű: vélhetőleg lényeges minta van az adatokban. (Valamilyen valószínűséggel cáfolni tudjuk a nulla hipotézist.)
43 Az a attribútum TESZT(A) tesztjének lehetséges értékei: v1, v2, v3,, vk TESZT(A) S : kiinduló mintahalmaz [p, n] p: a pozitív, n: a negatív minták száma S-ben S 1 : TESZT(A)=v1 értékekkel rendelkező minták halmaza, benne a pozitív és negatív minták száma [p 1, n 1 ] S 2 : TESZT(A)=v2 értékekkel rendelkező minták halmaza, benne a pozitív és negatív minták száma [p 2, n 2 ] S k : TESZT(A)=vk értékekkel rendelkező minták halmaza, benne a pozitív és negatív minták száma [p k, n k ]
44 pˆ i pi p n n i D p k nˆ i p pˆ n nˆ pˆ 2 2 i i i i nˆ i1 i i A D változó 2 eloszlást követ. Adott k (lehetséges teszteredmények száma) mellett a táblázat azt mutatja, hogy mi annak a valószínűsége, hogy a kiszámított relatív eltérés (D) eléri a megadottat, bár valójában irreleváns dolgot teszteltünk, ez csupán a véletlen műve: pi p n n i n SzF = k-1 P 0,5 P 0,2 P 0,1 P 0,05 P 0,01 P 0,005 P 0, ,46 1,64 2,71 3,84 6,64 7,88 10,83 2 1,39 3,22 4,61 5,99 9,21 10,60 13,82 3 2,37 4,64 6,25 7,82 11,35 12,84 16,27 4 3,36 5,99 7,78 9,49 13,28 14,86 18,47 5 4,35 7,29 9,24 11,07 15,09 16,75 20,52 6 5,35 8,56 10,65 12,59 16,81 18,55 22,46 7 6,35 9,80 12,02 14,07 18,48 20,28 24,32 8 7,34 11,03 13,36 15,51 20,09 21,96 26,12 9 8,34 12,24 14,68 16,92 21,67 23,59 27, ,34 13,44 15,99 18,31 23,21 25,19 29,59
45 Például: 400-at dobtunk pénzérmékkel és ebből 192 fej lett, 208 írás. Kiderült, hogy ebből 200-at egy adott százforintossal dobtunk, ebből 88 a fej, 112 az írás, utána adott húszforintossal dobtunk 200-at, ebből 104 a fej, 96 az írás. Állíthatjuk-e 99% biztonsággal, hogy az érmék különbözőek (a fej/írás kimenetel szempontjából), számít, hogy melyikkel dobunk? D=2,56
46 Döntési fa nyesése: második lehetőség Hibaarány komplexitás kompromisszumon alapuló metszés Egy kétosztályos (bináris) osztályozási példa kapcsán (Baloldali szám a C1 osztályba tartozó minták száma, jobboldali a C2-be tartozó minták száma) [3000,9000] 1 2 [500,4000] 8 [2500,500] 14 [0,4500] 3 [400,100] 4 9 [100,3900] [1145,120] 10 [1355,380] 5 [80, 20] 6 [0,580] 7 [20,3300] 11 [5,100] 12 [1350, 80] 13 [0, 200] Komplexitás legyen a levelek száma (lehetne más is), a példánkban: a gyökérnél 1, a kifejtett fánál 9 Hibaarány: a gyökérnél 3000/12000 (hiszen a jobb válaszunk C2 lenne), a kifejtett fánál: ( )/12000
47 Hibaarány komplexitás kompromisszumon alapuló metszés Számozzuk a csomópontokat, jelölés: - az n-dik csomópontot önmagában (mintha levél lenne) jelölje n - az n-edik csomópontból kiinduló részfa Tn n [3000,5000] R(n)=3000/8000 T(n) =1 m [1000,4000] p [2000,1000] d [990,10] k [10,3990] t [650,15] r [1350,985] g [5,990] [5,3000] f R(Tn)=( )/8000 T(Tn) =5 Hogyan hasonlítsuk össze a komplexitást a hibával?!?
48 Legyen az összetett, eredő költség (pl. az n-dik csomópontra): K ( n) EgységnyiHibaKöltségeR( n) EgységnyiKomplexitásKöltsége T ( n) Legyen a két költség aránya: EgységnyiKomplexitásKöltsége EgységnyiHibaKöltsége Így illetve K ( n) K( n) R( n) T ( n) EgységnyiHibaKöltsége K Tn = R Tn + α T(Tn) K Tn eredő költség K n R n T(n) = 1 R Tn T(Tn) > 1 kritikus
49 kritikus amikor mindegy, hogy levágjuk-e a részfát, az összetett költség azonos az n-edik csomópontra, mint levélre, és az n-dik csomópontból kiinduló Tn részfára R n + α kritikus T(n) = R Tn + α kritikus T(Tn) α kritikus = R n R(Tn) T(Tn) T(n) = R n R(Tn) T(Tn) 1 1. Ha =0, akkor a komplexitásnak nincs ára, soha nem érdemes visszametszeni 2. 0 < < kritikus, akkor még mindig jobb nem visszametszeni 3. Ha = kritikus, akkor mindegy, hogy visszavágjuk-e 4. Ha kritikus <, akkor érdemes visszavágni, olcsóbb abbahagyni az n-dik levélnél, nem kifejteni az innen induló részfát
50 Gondoljuk végig, hogy mi történik, ha t folyamatosan növeljük 0-tól indulva! amelyik csomópont kritikus értékét először érjük el, ott érdemes leginkább metszeni a fát! (Persze ha a hiba nem nő túl nagyra) 1 kritikus =0,12 2 kritikus =0,088 8 kritikus =0, kritikus =0, kritikus =0, A számok légből kapottak (csak a példa kedvéért)
Intelligens orvosi műszerek VIMIA023
Intelligens orvosi műszerek VIMIA023 A mintapéldákból tanuló számítógépes program (egyik lehetőség): döntési fák 2018 ősz http://www.mit.bme.hu/oktatas/targyak/vimia023 dr. Pataki Béla pataki@mit.bme.hu
Gépi tanulás. Egyszerű döntés tanulása (döntési fák) (Részben Dobrowiecki Tadeusz fóliáinak átdolgozásával) Pataki Béla (Bolgár Bence)
Gépi tanulás Egyszerű döntés tanulása (döntési fák) (Részben Dobrowiecki Tadeusz fóliáinak átdolgozásával) Pataki Béla (Bolgár Bence) BME I.E. 414, 463-26-79 pataki@mit.bme.hu, http://www.mit.bme.hu/general/staff/pataki
Mesterséges Intelligencia MI
Mesterséges Intelligencia MI Egyszerű döntés Döntési fák Tanuljuk meg! Metsszük meg! Pataki Béla Bolgár Bence BME I.E. 414, 463-26-79 pataki@mit.bme.hu, http://www.mit.bme.hu/general/staff/pataki Példaprobléma:
Mesterséges Intelligencia MI
Mesterséges Intelligencia MI Egyszerű döntés. Tanuljuk meg! Dobrowiecki Tadeusz Eredics Péter, és mások BME I.E. 437, 463-28-99 dobrowiecki@mit.bme.hu, http://www.mit.bme.hu/general/staff/tade ? Kétértékű
Gépi tanulás. Hány tanítómintára van szükség? VKH. Pataki Béla (Bolgár Bence)
Gépi tanulás Hány tanítómintára van szükség? VKH Pataki Béla (Bolgár Bence) BME I.E. 414, 463-26-79 pataki@mit.bme.hu, http://www.mit.bme.hu/general/staff/pataki Induktív tanulás A tanítás folyamata: Kiinduló
Mesterséges Intelligencia MI
Mesterséges Intelligencia MI Gépi tanulás elemei Dobrowiecki Tadeusz Eredics Péter, és mások BME I.E. 437, 463-28-99 dobrowiecki@mit.bme.hu, http://www.mit.bme.hu/general/staff/tade Egy intelligens rendszer
[1000 ; 0] 7 [1000 ; 3000]
Gépi tanulás (vimim36) Gyakorló feladatok 04 tavaszi félév Ahol lehet, ott konkrét számértékeket várok nem puszta egyenleteket. (Azok egy részét amúgyis megadom.). Egy bináris osztályozási feladatra tanított
2. A példahalmazban n = 3 negatív és p = 3 pozitív példa van, azaz a példahalmazt képviselő döntési fa információtartalma: I = I(1/2, 1/2) = 1 bit.
Példa 1. Döntési fa számítása/1 1. Legyen a felhasználandó példahalmaz: Példa sz. Nagy(x) Fekete(x) Ugat(x) JóKutya(x) X1 Igen Igen Igen Nem X2 Igen Igen Nem Igen X3 Nem Nem Igen Nem X4 Nem Igen Igen Igen
Gépi tanulás. Féligellenőrzött tanulás. Pataki Béla (Bolgár Bence)
Gépi tanulás Féligellenőrzött tanulás Pataki Béla (Bolgár Bence) BME I.E. 414, 463-26-79 pataki@mit.bme.hu, http://www.mit.bme.hu/general/staff/pataki Féligellenőrzött tanulás Mindig kevés az adat, de
1. gyakorlat. Mesterséges Intelligencia 2.
1. gyakorlat Mesterséges Intelligencia. Elérhetőségek web: www.inf.u-szeged.hu/~gulyasg mail: gulyasg@inf.u-szeged.hu Követelmények (nem teljes) gyakorlat látogatása kötelező ZH írása a gyakorlaton elhangzott
Gépi tanulás Gregorics Tibor Mesterséges intelligencia
Gépi tanulás Tanulás fogalma Egy algoritmus akkor tanul, ha egy feladat megoldása során olyan változások következnek be a működésében, hogy később ugyanazt a feladatot vagy ahhoz hasonló más feladatokat
Mesterséges Intelligencia I. (I602, IB602)
Dr. Jelasity Márk Mesterséges Intelligencia I. (I602, IB602) kurzus kilencedik előadásának jegyzete (2008. november 3.) Tanulás (Learning) Készítette: Szabó Péter EHA: SZPNAAT.SZE Szeged, 2008. december
Új típusú döntési fa építés és annak alkalmazása többtényezős döntés területén
Új típusú döntési fa építés és annak alkalmazása többtényezős döntés területén Dombi József Szegedi Tudományegyetem Bevezetés - ID3 (Iterative Dichotomiser 3) Az ID algoritmusok egy elemhalmaz felhasználásával
Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.
Regresszió Csorba János Nagyméretű adathalmazok kezelése 2010. március 31. A feladat X magyarázó attribútumok halmaza Y magyarázandó attribútumok) Kérdés: f : X -> Y a kapcsolat pár tanítópontban ismert
Keresés képi jellemzők alapján. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék
Keresés képi jellemzők alapján Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék Lusta gépi tanulási algoritmusok Osztályozás: k=1: piros k=5: kék k-legközelebbi szomszéd (k=1,3,5,7)
Programozási módszertan. A gépi tanulás alapmódszerei
SZDT-12 p. 1/24 Programozási módszertan A gépi tanulás alapmódszerei Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu SZDT-12 p. 2/24 Ágensek Az új
VIII. INDUKTÍV TANULÁS
Induktív tanulás VIII. INDUKTÍV TANULÁS Induktív tanulási modell Az f leképezést tanuljuk meg az (x i,f(x i )) példák (minták) alapján úgy, hogy előállítunk egy olyan h leképezést (hipotézist), amelyre
Intelligens orvosi műszerek VIMIA023
Intelligens orvosi műszerek VIMIA023 Neurális hálók (Dobrowiecki Tadeusz anyagának átdolgozásával) 2017 ősz http://www.mit.bme.hu/oktatas/targyak/vimia023 dr. Pataki Béla pataki@mit.bme.hu (463-)2679 A
Mesterséges Intelligencia MI
Mesterséges Intelligencia MI Valószínűségi hálók - következtetés Dobrowiecki Tadeusz Eredics Péter, és mások BME I.E. 437, 463-28-99 dobrowiecki@mit.bme.hu, http://www.mit.bme.hu/general/staff/tade Következtetés
Számítógépes képelemzés 7. előadás. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék
Számítógépes képelemzés 7. előadás Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék Momentumok Momentum-alapú jellemzők Tömegközéppont Irányultáság 1 2 tan 2 1 2,0 1,1 0, 2 Befoglaló
TANULÁS. I. Logikai formulák tanulása. Tanulási módok. Miért m ködik jól az induktív tanulás? Induktív tanulás
TANULÁS Egy algoritmus tanul, ha egy feladat megoldása során olyan változások következnek be a m ködésében, hogy kés bb ugyanazt a feladatot vagy ahhoz hasonló más feladatokat jobb eredménnyel, illetve
Mesterséges Intelligencia MI
Mesterséges Intelligencia MI A szükséges mintaszám krlát elemzése Pataki Béla BME I.E. 414, 463-26-79 pataki@mit.bme.hu, http://www.mit.bme.hu/general/staff/pataki Mit is jelent az eredmény, ha pnts lenne
Gépi tanulás a gyakorlatban. Lineáris regresszió
Gépi tanulás a gyakorlatban Lineáris regresszió Lineáris Regresszió Legyen adott egy tanuló adatbázis: Rendelkezésünkre áll egy olyan előfeldolgozott adathalmaz, aminek sorai az egyes ingatlanokat írják
Normális eloszlás tesztje
Valószínűség, pontbecslés, konfidenciaintervallum Normális eloszlás tesztje Kolmogorov-Szmirnov vagy Wilk-Shapiro próba. R-funkció: shapiro.test(vektor) balra ferde eloszlás jobbra ferde eloszlás balra
Mesterséges Intelligencia MI
Mesterséges Intelligencia MI Problémamegoldás kereséssel ha sötétben tapogatózunk Dobrowiecki Tadeusz Eredics Péter, és mások BME I.E. 437, 463-28-99 dobrowiecki@mit.bme.hu, http://www.mit.bme.hu/general/staff/tade
Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió
SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás
Random Forests - Véletlen erdők
Random Forests - Véletlen erdők Szabó Adrienn Adatbányászat és Webes Keresés Kutatócsoport 2010 Tartalom Fő forrás: Leo Breiman: Random Forests Machine Learning, 45, 5-32, 2001 Alapok Döntési fa Véletlen
Hipotézis vizsgálatok
Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével
Adatok statisztikai értékelésének főbb lehetőségei
Adatok statisztikai értékelésének főbb lehetőségei 1. a. Egy- vagy kétváltozós eset b. Többváltozós eset 2. a. Becslési problémák, hipotézis vizsgálat b. Mintázatelemzés 3. Szint: a. Egyedi b. Populáció
Bizonytalanságok melletti következtetés
Bizonytalanságok melletti következtetés Mesterséges Intelligencia I. Valószínűségi alapfogalmak (ismétlés) A, B,C események esetén a priori valószínűség: feltételes (a posteiori) valószínűség: Bayes-formula
( 1) i 2 i. megbízhatóságú a levont következtetése? A matematikai statisztika eszközeivel értékelje a kapott eredményeket!
1. Név:......................... Egy szabályos pénzérmét feldobunk, ha az els½o FEJ az i-edik dobásra jön, akkor a játékos nyereménye ( 1) i i forint. Vizsgálja szimulációval a játékot, különböz½o induló
Függetlenségvizsgálat, Illeszkedésvizsgálat
Varga Beatrix, Horváthné Csolák Erika Függetlenségvizsgálat, Illeszkedésvizsgálat 4. előadás Üzleti statisztika A sokaság/minta több ismérv szerinti vizsgálata A statisztikai elemzés egyik ontos eladata
Gépi tanulás. A szükséges mintaszám korlát elemzése. Pataki Béla (Bolgár Bence)
Gépi tanulás A szükséges mintaszám krlát elemzése Pataki Béla (Blgár Bence) BME I.E. 414, 463-26-79 pataki@mit.bme.hu, http://www.mit.bme.hu/general/staff/pataki A Russell-Nrvig könyv n=10 bemenetű lgikai
Feladatok és megoldások a 8. hétre Építőkari Matematika A3
Feladatok és megoldások a 8. hétre Építőkari Matematika A3 1. Oldjuk meg a következő differenciálegyenlet rendszert: x + 2y 3x + 4y = 2 sin t 2x + y + 2x y = cos t. (1 2. Oldjuk meg a következő differenciálegyenlet
BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.
BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011. 1 Mérési hibák súlya és szerepe a mérési eredményben A mérési hibák csoportosítása A hiba rendűsége Mérési bizonytalanság Standard és kiterjesztett
Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok
STATISZTIKA 1. Előadás Hipotézisvizsgálatok Tematika 1. Hipotézis vizsgálatok 2. t-próbák 3. Variancia-analízis 4. A variancia-analízis validálása, erőfüggvény 5. Korreláció számítás 6. Kétváltozós lineáris
STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás
ELŐADÁS ÁTTEKINTÉSE STATISZTIKA 9. Előadás Binomiális eloszlás Egyenletes eloszlás Háromszög eloszlás Normális eloszlás Standard normális eloszlás Normális eloszlás mint modell 2/62 Matematikai statisztika
Feladatok és megoldások az 1. sorozat Építőkari Matematika A3
Feladatok és megoldások az 1. sorozat Építőkari Matematika A3 1. Tegyük fel, hogy A és B egymást kölcsönösen kizáró események, melyekre P{A} = 0.3 és P{B} = 0.. Mi a valószínűsége, hogy (a A vagy B bekövetkezik;
Biostatisztika VIII. Mátyus László. 19 October
Biostatisztika VIII Mátyus László 19 October 2010 1 Ha σ nem ismert A gyakorlatban ritkán ismerjük σ-t. Ha kiszámítjuk s-t a minta alapján, akkor becsülhetjük σ-t. Ez további bizonytalanságot okoz a becslésben.
Intelligens orvosi műszerek (VIMIA023) Gyakorló feladatok, megoldással (2016 ősz)
Intelligens orvosi műszerek (VIMIA23) Gyakorló feladatok, megoldással (216 ősz) Régi zárthelyi- és vizsgafeladatok, egyéb feladatok megoldással. Nem jelenti azt, hogy pontosan ezek, vagy pontosan ilyenek
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,
Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )
Budapesti Műszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék, Budapest, Műegyetem rkp. 3. D ép. 334. Tel: 463-6-80 Fa: 463-30-9 http://www.vizgep.bme.hu Alap-ötlet:
GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet
GVMST22GNC Statisztika II. 3. előadás: 8. Hipotézisvizsgálat Kóczy Á. László Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Hipotézisvizsgálat v becslés Becslés Ismeretlen paraméter Közeĺıtő
Számelméleti alapfogalmak
1 Számelméleti alapfogalmak 1 Definíció Az a IN szám osztója a b IN számnak ha létezik c IN melyre a c = b Jelölése: a b 2 Példa a 0 bármely a számra teljesül, mivel c = 0 univerzálisan megfelel: a 0 =
1. Név:... Neptun Kód:... Feladat: Egy összeszerel½o üzemben 3 szalag van. Mindehárom szalagon ugyanazt
1. Név:......................... Egy összeszerel½o üzemben 3 szalag van. Mindehárom szalagon ugyanazt a gyártmányt készítik. Egy gyártmány összeszerelési ideje normális eloszlású valószín½uségi változó
STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése
4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól
Intelligens Rendszerek Elmélete. Versengéses és önszervező tanulás neurális hálózatokban
Intelligens Rendszerek Elmélete : dr. Kutor László Versengéses és önszervező tanulás neurális hálózatokban http://mobil.nik.bmf.hu/tantargyak/ire.html Login név: ire jelszó: IRE07 IRE 9/1 Processzor Versengéses
Bizonytalanság. Mesterséges intelligencia április 4.
Bizonytalanság Mesterséges intelligencia 2014. április 4. Bevezetés Eddig: logika, igaz/hamis Ha nem teljes a tudás A világ nem figyelhető meg közvetlenül Részleges tudás nem reprezentálható logikai eszközökkel
Statisztikai következtetések Nemlineáris regresszió Feladatok Vége
[GVMGS11MNC] Gazdaságstatisztika 10. előadás: 9. Regressziószámítás II. Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet A standard lineáris modell
Döntési fák. (Klasszifikációs és regressziós fák: (Classification And Regression Trees: CART ))
Döntési fák (Klasszifikációs és regressziós fák: (Classification And Regression Trees: CART )) Rekurzív osztályozó módszer, Klasszifikációs és regressziós fák folytonos, kategóriás, illetve túlélés adatok
Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás
Matematikai alapok és valószínőségszámítás Valószínőségi eloszlások Binomiális eloszlás Bevezetés A tudományos életben megfigyeléseket teszünk, kísérleteket végzünk. Ezek többféle különbözı eredményre
1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása
HIPOTÉZIS VIZSGÁLAT A hipotézis feltételezés egy vagy több populációról. (pl. egy gyógyszer az esetek 90%-ában hatásos; egy kezelés jelentősen megnöveli a rákos betegek túlélését). A hipotézis vizsgálat
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs rendszerek Tanszék. Neurális hálók. Pataki Béla
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs rendszerek Tanszék Neurális hálók Előadó: Előadás anyaga: Hullám Gábor Pataki Béla Dobrowiecki Tadeusz BME I.E. 414, 463-26-79
Teljesen elosztott adatbányászat pletyka algoritmusokkal. Jelasity Márk Ormándi Róbert, Hegedűs István
Teljesen elosztott adatbányászat pletyka algoritmusokkal Jelasity Márk Ormándi Róbert, Hegedűs István Motiváció Nagyméretű hálózatos elosztott alkalmazások az Interneten egyre fontosabbak Fájlcserélő rendszerek
Tanulási cél Szorzatfüggvényekre vonatkozó integrálási technikák megismerése és különböző típusokra való alkalmazása. 5), akkor
Integrálszámítás Integrálási szabályok Tanulási cél Szorzatfüggvényekre vonatkozó integrálási technikák megismerése és különböző típusokra való alkalmazása Motivációs feladat Valószínűség-számításnál találkozhatunk
Mesterséges Intelligencia MI
Mesterséges Intelligencia MI Keresés ellenséges környezetben Dobrowiecki Tadeusz Eredics Péter, és mások BME I.E. 437, 463-28-99 dobrowiecki@mit.bme.hu, http://www.mit.bme.hu/general/staff/tade Ellenség
Véletlenszám generátorok és tesztelésük. Tossenberger Tamás
Véletlenszám generátorok és tesztelésük Tossenberger Tamás Érdekességek Pénzérme feldobó gép: $0,25-os érme 1/6000 valószínűséggel esik az élére 51% eséllyel érkezik a felfelé mutató oldalára Pörgetésnél
f(x) vagy f(x) a (x x 0 )-t használjuk. lim melyekre Mivel itt ɛ > 0 tetszőlegesen kicsi, így a a = 0, a = a, ami ellentmondás, bizonyítva
6. FÜGGVÉNYEK HATÁRÉRTÉKE ÉS FOLYTONOSSÁGA 6.1 Függvény határértéke Egy D R halmaz torlódási pontjainak halmazát D -vel fogjuk jelölni. Definíció. Legyen f : D R R és legyen x 0 D (a D halmaz torlódási
Algoritmusok Tervezése. 6. Előadás Algoritmusok 101 Dr. Bécsi Tamás
Algoritmusok Tervezése 6. Előadás Algoritmusok 101 Dr. Bécsi Tamás Mi az algoritmus? Lépések sorozata egy feladat elvégzéséhez (legáltalánosabban) Informálisan algoritmusnak nevezünk bármilyen jól definiált
STATISZTIKAI PROBLÉMÁK A
STATISZTIKAI PROBLÉMÁK A HULLÁMTÉR REPRODUKCIÓ TERÜLETÉN 2012. május 3., Budapest Firtha Gergely PhD hallgató, Akusztikai Laboratórium BME Híradástechnikai Tanszék firtha@hit.bme.hu Tartalom A hangtér
Mesterséges Intelligencia I.
Mesterséges Intelligencia I. 10. elıadás (2008. november 10.) Készítette: Romhányi Anita (ROANAAT.SZE) - 1 - Statisztikai tanulás (Megfigyelések alapján történı bizonytalan következetésnek tekintjük a
Mit látnak a robotok? Bányai Mihály Matemorfózis, 2017.
Mit látnak a robotok? Bányai Mihály Matemorfózis, 2017. Vizuális feldolgozórendszerek feladatai Mesterséges intelligencia és idegtudomány Mesterséges intelligencia és idegtudomány Párhuzamos problémák
Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás
STATISZTIKA Hipotézis, sejtés 11. Előadás Hipotézisvizsgálatok, nem paraméteres próbák Tudományos hipotézis Nullhipotézis felállítása (H 0 ): Kétmintás hipotézisek Munkahipotézis (H a ) Nullhipotézis (H
Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés
Gépi tanulás a gyakorlatban Kiértékelés és Klaszterezés Hogyan alkalmazzuk sikeresen a gépi tanuló módszereket? Hogyan válasszuk az algoritmusokat? Hogyan hangoljuk a paramétereiket? Precízebben: Tegyük
Az értékelés során következtetést fogalmazhatunk meg a
Az értékelés során következtetést fogalmazhatunk meg a a tanuló teljesítményére, a tanulási folyamatra, a célokra és követelményekre a szülők teljesítményére, a tanulási folyamatra, a célokra és követelményekre
Elengedhetetlen a játékokban, mozi produkciós eszközökben Nélküle kvantum hatás lép fel. Az objektumok áthaladnak a többi objektumon
Bevezetés Ütközés detektálás Elengedhetetlen a játékokban, mozi produkciós eszközökben Nélküle kvantum hatás lép fel Az objektumok áthaladnak a többi objektumon A valósághű megjelenítés része Nem tisztán
Kettőnél több csoport vizsgálata. Makara B. Gábor
Kettőnél több csoport vizsgálata Makara B. Gábor Három gyógytápszer elemzéséből az alábbi energia tartalom adatok származtak (kilokalória/adag egységben) Három gyógytápszer elemzésébô A B C 30 5 00 10
Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet
Kettőnél több csoport vizsgálata Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet Gyógytápszerek (kilokalória/adag) Három gyógytápszer A B C 30 5 00 10 05 08 40 45 03 50 35 190 Kérdések: 1. Van-e
2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben
1 feladatsor 1 Egy dobozban 20 fehér golyó van Egy szabályos dobókockával dobunk, majd a következ t tesszük: ha a dobott szám 1,2 vagy 3, akkor tíz golyót cserélünk ki pirosra; ha a dobott szám 4 vagy
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen
1. Alapfogalmak Algoritmus Számítási probléma Specifikáció Algoritmusok futási ideje
1. Alapfogalmak 1.1. Algoritmus Az algoritmus olyan elemi műveletekből kompozíciós szabályok szerint felépített összetett művelet, amelyet megadott feltételt teljesítő bemeneti adatra végrehajtva, a megkívánt
Nagyságrendek. Kiegészítő anyag az Algoritmuselmélet tárgyhoz. Friedl Katalin BME SZIT február 1.
Nagyságrendek Kiegészítő anyag az Algoritmuselmélet tárgyhoz (a Rónyai Ivanyos Szabó: Algoritmusok könyv mellé) Friedl Katalin BME SZIT friedl@cs.bme.hu 018. február 1. Az O, Ω, Θ jelölések Az algoritmusok
A PiFast program használata. Nagy Lajos
A PiFast program használata Nagy Lajos Tartalomjegyzék 1. Bevezetés 3 2. Bináris kimenet létrehozása. 3 2.1. Beépített konstans esete.............................. 3 2.2. Felhasználói konstans esete............................
Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58
u- t- Matematikai statisztika Gazdaságinformatikus MSc 2. előadás 2018. szeptember 10. 1/58 u- t- 2/58 eloszlás eloszlás m várható értékkel, σ szórással N(m, σ) Sűrűségfüggvénye: f (x) = 1 e (x m)2 2σ
Számítógép és programozás 2
Számítógép és programozás 2 6. Előadás Problémaosztályok http://digitus.itk.ppke.hu/~flugi/ Emlékeztető A specifikáció egy előfeltételből és utófeltételből álló leírása a feladatnak Léteznek olyan feladatok,
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 10 X. SZIMULÁCIÓ 1. VÉLETLEN számok A véletlen számok fontos szerepet játszanak a véletlen helyzetek generálásában (pénzérme, dobókocka,
KÖZELÍTŐ INFERENCIA II.
STATISZTIKAI TANULÁS AZ IDEGRENDSZERBEN KÖZELÍTŐ INFERENCIA II. MONTE CARLO MÓDSZEREK ISMÉTLÉS Egy valószínűségi modellben a következtetéseinket a látensek vagy a paraméterek fölötti poszterior írja le.
Osztályozás, regresszió. Nagyméretű adathalmazok kezelése Tatai Márton
Osztályozás, regresszió Nagyméretű adathalmazok kezelése Tatai Márton Osztályozási algoritmusok Osztályozás Diszkrét értékkészletű, ismeretlen attribútumok értékének meghatározása ismert attribútumok értéke
Intelligens orvosi műszerek (VIMIA023) Gyakorló feladatok a vizsgára 2015 Nem pontosan ezek lesznek a vizsgafeladatok, csak jellegükre hasonlók!
Nem pontosan ezek lesznek a vizsgafeladatok, csak jellegükre hasonlók! A jelek, zajok idő- és frekvenciatartománybeli reprezentációjával, tulajdonságaikkal kapcsolatos konkrét feladat (számpélda) megoldásának
Logika és informatikai alkalmazásai
Logika és informatikai alkalmazásai 4. gyakorlat Németh L. Zoltán http://www.inf.u-szeged.hu/~zlnemeth SZTE, Informatikai Tanszékcsoport 2011 tavasz Irodalom Szükséges elmélet a mai gyakorlathoz Előadás
MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI
MÉRÉSI EREDMÉYEK POTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI. A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk
JAVASLAT A TOP-K ELEMCSERÉK KERESÉSÉRE NAGY ONLINE KÖZÖSSÉGEKBEN
JAVASLAT A TOP-K ELEMCSERÉK KERESÉSÉRE NAGY ONLINE KÖZÖSSÉGEKBEN Supporting Top-k item exchange recommendations in large online communities Barabás Gábor Nagy Dávid Nemes Tamás Probléma Cserekereskedelem
Mesterséges Intelligencia MI
Mesterséges Intelligencia MI Racionalitás: a hasznosság és a döntés Dobrowiecki Tadeusz Eredics Péter, és mások BME I.E. 437, 463-28-99 dobrowiecki@mit.bme.hu, http://www.mit.bme.hu/general/staff/tade
[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria Bódis Emőke 2016. 04. 25. J J 9 Korrelációanalízis Regresszióanalízis: hogyan változik egy vizsgált változó értéke egy másik változó változásának függvényében. Korrelációs
Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János
Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision
Modellezés és szimuláció. Szatmári József SZTE Természeti Földrajzi és Geoinformatikai Tanszék
Modellezés és szimuláció Szatmári József SZTE Természeti Földrajzi és Geoinformatikai Tanszék Kvantitatív forradalmak a földtudományban - geográfiában 1960- as évek eleje: statisztika 1970- as évek eleje:
Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE
Tartalomjegyzék 5 Tartalomjegyzék Előszó I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE 1. fejezet: Kontrollált kísérletek 21 1. A Salk-oltás kipróbálása 21 2. A porta-cava sönt 25 3. Történeti kontrollok 27 4. Összefoglalás
0,424 0,576. f) P (X 2 = 3) g) P (X 3 = 1) h) P (X 4 = 1 vagy 2 X 2 = 2) i) P (X 7 = 3, X 4 = 1, X 2 = 2 X 0 = 2) j) P (X 7 = 3, X 4 = 1, X 2 = 2)
Legyen adott a P átmenetvalószín ség mátrix és a ϕ 0 kezdeti eloszlás Kérdés, hogy miként lehetne meghatározni az egyes állapotokban való tartózkodás valószín ségét az n-edik lépés múlva Deniáljuk az n-lépéses
Neurális hálózatok bemutató
Neurális hálózatok bemutató Füvesi Viktor Miskolci Egyetem Alkalmazott Földtudományi Kutatóintézet Miért? Vannak feladatok amelyeket az agy gyorsabban hajt végre mint a konvencionális számítógépek. Pl.:
A lineáris programozás alapfeladata Standard alak Az LP feladat megoldása Az LP megoldása: a szimplex algoritmus 2018/
Operációkutatás I. 2018/2019-2. Szegedi Tudományegyetem Informatika Intézet Számítógépes Optimalizálás Tanszék 2. Előadás LP alapfeladat A lineáris programozás (LP) alapfeladata standard formában Max c
Intelligens Rendszerek Gyakorlata. Neurális hálózatok I.
: Intelligens Rendszerek Gyakorlata Neurális hálózatok I. dr. Kutor László http://mobil.nik.bmf.hu/tantargyak/ir2.html IRG 3/1 Trend osztályozás Pnndemo.exe IRG 3/2 Hangulat azonosítás Happy.exe IRG 3/3
Logika és informatikai alkalmazásai
Logika és informatikai alkalmazásai 4. gyakorlat Németh L. Zoltán http://www.inf.u-szeged.hu/~zlnemeth SZTE, Informatikai Tanszékcsoport 2011 tavasz Irodalom Szükséges elmélet a mai gyakorlathoz Előadás
Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév
Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév 1. A várható érték és a szórás transzformációja 1. Ha egy valószínűségi változóhoz hozzáadunk ötöt, mínusz ötöt, egy b konstanst,
Biomatematika 2 Orvosi biometria
Biomatematika 2 Orvosi biometria 2017.02.13. Populáció és minta jellemző adatai Hibaszámítás Valószínűség 1 Esemény Egy kísérlet vagy megfigyelés (vagy mérés) lehetséges eredményeinek összessége (halmaza)
KUTATÁSMÓDSZERTAN 4. ELŐADÁS. A minta és mintavétel
KUTATÁSMÓDSZERTAN 4. ELŐADÁS A minta és mintavétel 1 1. A MINTA ÉS A POPULÁCIÓ VISZONYA Populáció: tágabb halmaz, alapsokaság a vizsgálandó csoport egésze Minta: részhalmaz, az alapsokaság azon része,
Asszociációs szabályok
Asszociációs szabályok Nikházy László Nagy adathalmazok kezelése 2010. március 10. Mi az értelme? A ö asszociációs szabály azt állítja, hogy azon vásárlói kosarak, amik tartalmaznak pelenkát, általában
A mérési eredmény megadása
A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk meg: a determinisztikus és a véletlenszerű
Függvények növekedési korlátainak jellemzése
17 Függvények növekedési korlátainak jellemzése A jellemzés jól bevált eszközei az Ω, O, Θ, o és ω jelölések. Mivel az igények általában nemnegatívak, ezért az alábbi meghatározásokban mindenütt feltesszük,
A lineáris programozás alapfeladata Standard alak Az LP feladat megoldása Az LP megoldása: a szimplex algoritmus 2017/
Operációkutatás I. 2017/2018-2. Szegedi Tudományegyetem Informatika Intézet Számítógépes Optimalizálás Tanszék 2. Előadás LP alapfeladat A lineáris programozás (LP) alapfeladata standard formában Max c
Mesterséges Intelligencia MI
Mesterséges Intelligencia MI Problémamegoldás kereséssel - csak lokális információra alapozva Pataki Béla BME I.E. 414, 463-26-79 pataki@mit.bme.hu, http://www.mit.bme.hu/general/staff/pataki Lokálisan