Intelligens orvosi műszerek (VIMIA023) Gyakorló feladatok a vizsgára 2015 Nem pontosan ezek lesznek a vizsgafeladatok, csak jellegükre hasonlók!

Hasonló dokumentumok
Gyakorló többnyire régebbi zh feladatok. Intelligens orvosi műszerek október 2.

Intelligens orvosi műszerek (VIMIA023) Gyakorló feladatok, megoldással (2016 ősz)

[1000 ; 0] 7 [1000 ; 3000]

Jelek és rendszerek 1. 10/9/2011 Dr. Buchman Attila Informatikai Rendszerek és Hálózatok Tanszék

Mérés 3 - Ellenörzö mérés - 5. Alakítsunk A-t meg D-t oda-vissza (A/D, D/A átlakító)

2. Hangfrekvenciás mechanikai rezgések vizsgálata jegyzőkönyv. Zsigmond Anna Fizika Bsc II. Mérés dátuma: Leadás dátuma:

Intelligens orvosi műszerek VIMIA023

E x μ x μ K I. és 1. osztály. pontokként), valamint a bayesi döntést megvalósító szeparáló görbét (kék egyenes)

A maximum likelihood becslésről

Villamos jelek mintavételezése, feldolgozása. LabVIEW 7.1

Irányításelmélet és technika II.

EGYENÁRAMÚ TÁPEGYSÉGEK

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI

Méréselmélet és mérőrendszerek 2. ELŐADÁS (1. RÉSZ)

A regisztrált álláskeresők számára vonatkozó becslések előrejelző képességének vizsgálata

Milyen elvi mérési és számítási módszerrel lehet a Thevenin helyettesítő kép elemeit meghatározni?

Négyszög - Háromszög Oszcillátor Mérése Mérési Útmutató

2005_01/1 Leírtunk egymás mellé hét racionális számot úgy, hogy a két szélső kivételével mindegyik eggyel nagyobb a két szomszédja szorzatánál.

[Biomatematika 2] Orvosi biometria

Az értékelés során következtetést fogalmazhatunk meg a

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

Villamos jelek mintavételezése, feldolgozása. LabVIEW előadás

ÉRZÉKELŐK ÉS BEAVATKOZÓK I. 3. MÉRÉSFELDOLGOZÁS

2. Elméleti összefoglaló

Mérés és adatgyűjtés

Mérési jegyzőkönyv a 5. mérés A/D és D/A átalakító vizsgálata című laboratóriumi gyakorlatról

Billenő áramkörök Jelterjedés hatása az átvitt jelre

Kabos: Statisztika II. ROC elemzések Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem.

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

ALAPFOGALMIKÉRDÉSEK VILLAMOSSÁGTANBÓL 1. EGYENÁRAM

A bemeneti mérés eredménye az 1. évfolyamon

Hangtechnikus Hangtechnikus Hangmester Hangtechnikus

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Biostatisztika VIII. Mátyus László. 19 October

2. gyakorlat Mintavételezés, kvantálás

Makroökonómia. 8. szeminárium

Mesterséges Intelligencia MI

Feszültségérzékelők a méréstechnikában

6. Előadás. Vereb György, DE OEC BSI, október 12.

A mintavételezéses mérések alapjai

Méréselmélet és mérőrendszerek

Matematika. 1. évfolyam. I. félév

Hangtechnika. Médiatechnológus asszisztens

1. Visszacsatolás nélküli kapcsolások

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

RC tag mérési jegyz könyv

1. konferencia: Egyenáramú hálózatok számítása

Infokommunikációs hálózatépítő és üzemeltető

Akusztikus aktivitás AE vizsgálatoknál

Mérési hibák

Mesterséges Intelligencia MI

4. mérés Jelek és jelvezetékek vizsgálata

Elektronikai műszerész Elektronikai műszerész

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Mûveleti erõsítõk I.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Elektromiográfia (Dinamometria) A motoros egységek toborzása, az izomfáradás vizsgálata A mérési adatok elemzése és értékelése

Nehézségi gyorsulás mérése megfordítható ingával

Fourier-sorok. Lengyelné Dr. Szilágyi Szilvia április 7.

PWM elve, mikroszervó motor vezérlése MiniRISC processzoron

Analóg elektronika - laboratóriumi gyakorlatok

Trigonometria Megoldások. 1) Igazolja, hogy ha egy háromszög szögeire érvényes az alábbi összefüggés: sin : sin = cos + : cos +, ( ) ( )

Gyakorló feladatok a 2. zh-ra MM hallgatók számára

A mérési eredmény megadása

A mérés. A mérés célja a mérendő mennyiség valódi értékének meghatározása. Ez a valóságban azt jelenti, hogy erre kell

Least Squares becslés

3. Az alábbi adatsor egy rugó hosszát ábrázolja a rá ható húzóerő függvényében:

RC és RLC áramkörök vizsgálata

Bevezetés a méréstechnikába és jelfeldolgozásba 7. mérés RC tag Bartha András, Dobránszky Márk

b) Melyikben szerepel az ezres helyiértéken a 6-os alaki értékű szám? c) Melyik helyiértéken áll az egyes számokban a 6-os alaki értékű szám?

A mérések általános és alapvető metrológiai fogalmai és definíciói. Mérések, mérési eredmények, mérési bizonytalanság. mérés. mérési elv

Elektroencephalogram (EEG) vizsgálata Az alfa- és béta aktivitás változás vizsgálata (EEG II) A mérési adatok elemzése és értékelése

1. Adja meg az áram egységének mértékrendszerünkben (m, kg, s, A) érvényes definícióját!

ANOVA összefoglaló. Min múlik?

Hódmezővásárhelyi Városi Matematikaverseny április 14. A osztályosok feladatainak javítókulcsa

Az enyhe értelmi fogyatékos fővárosi tanulók 2009/2010. tanévi kompetenciaalapú matematika- és szövegértés-mérés eredményeinek elemzése

8. OSZTÁLY ; ; ; 1; 3; ; ;.

Mintavételezés és AD átalakítók

Kompetens szoftvertesztelés a gyakorlatban II. zárthelyi dolgozat

1. Melyek azok a kétjegyű számok, amelyek oszthatók számjegyeik

A fordítóprogramok szerkezete. Kódoptimalizálás. A kódoptimalizálás célja. A szintézis menete valójában. Kódoptimalizálási lépések osztályozása

DTMF Frekvenciák Mérése Mérési Útmutató

TANMENETJAVASLAT AZ ÚJ KERETTANTERVHEZ MATEMATIKA 1. ÉVFOLYAM KÉSZÍTETTÉK: KURUCZNÉ BORBÉLY MÁRTA ÉS VARGA LÍVIA TANKÖNYVSZERZŐK 2013

1. oldal, összesen: 5

STATISZTIKAI PROBLÉMÁK A

Kísérlettervezés alapfogalmak

A 2013/2014. tanévi Országos Középiskolai Tanulmányi Verseny döntő forduló FIZIKA II. KATEGÓRIA FELADATOK. Különösen viselkedő oszcillátor vizsgálata

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Makroökonómia (G-Kar és HR) gyakorló feladatok az 1. és 2. szemináriumra

Oktatáskutató és Fejlesztő Intézet TÁMOP / XXI. századi közoktatás (fejlesztés, koordináció) II. szakasz. Fejlesztőfeladatok

A 27/2012 (VIII. 27.) NGM rendelet (12/2013 (III.28) NGM rendelet által módosított) szakmai és vizsgakövetelménye alapján.

Fogyasztás, beruházás és rövid távú árupiaci egyensúly kétszektoros makromodellekben

3 Ellenállás mérés az U és az I összehasonlítása alapján. 3.a mérés: Ellenállás mérése feszültségesések összehasonlítása alapján.

Zaj- és rezgés. Törvényszerűségek

2. MÉRÉSELMÉLETI ISMERETEK

Tájékoztató. Használható segédeszköz: számológép

Készítette:

Az egyszerűsítés utáni alak:

Átírás:

Nem pontosan ezek lesznek a vizsgafeladatok, csak jellegükre hasonlók! A jelek, zajok idő- és frekvenciatartománybeli reprezentációjával, tulajdonságaikkal kapcsolatos konkrét feladat (számpélda) megoldásának bemutatása. 1. Egy periodikus jel 3 szinuszos jelkomponens összegéből áll, az egyes szinuszok periódusideje rendre 13 mp, 7,5 mp, illetve 5 mp. Mekkora az eredő periodikus jel periódusideje és frekvenciája? 2. Egy T P = 0,1 mp periódusidejű periodikus jel 4 szinuszos komponensből áll, ezek periódusideje rendre T P1 = 0,05 mp; T P2 = 0,02 mp; T P3 = 0,025 mp; T P4 = 0,00625 mp. Elég-e ebből a jelből f s = 30 Hz-el mintát venni ahhoz, hogy hibamentesen visszaállítható legyen a mintavett értékekből? 3. Egy T P = 0,1 mp periódusidejű periodikus jel 4 szinuszos komponensből áll, ezek periódusideje rendre T P1 = 0,05 mp; T P2 = 0,02 mp; T P3 = 0,025 mp; T P4 = 0,00625 mp. Rajzolja fel a jel frekvenciaamplitúdó diagramját! 4. A. Egy periodikus jel 2 szinuszos jelkomponens összegéből áll, az egyes szinuszok frekvenciája rendre 11,1 Hz, illetve 3,7 Hz. Mekkora az eredő periodikus jel periódusideje? B. Valaki azt állította, hogy egy 2 másodperc hosszúságú ablakkal végrehajtott mozgóablak átlagolás ezt a periodikus jelet teljesen el tudja nyomni. Indokolja meg, hogy miért van vagy nincs igaza! 5. Egy műszerrel 200 Hz-es szinuszos jel nagyságát akarjuk mérni, de a hálózatból származó 50 Hz-es szinuszos zavar meghamisítja a mérést. Mi lesz az eredmény, ha egy 40 ms hosszúságú ablakkal mozgóablak átlagolást végzünk a zaj kiszűrésére?

Átlagolással, mediánszűréssel kapcsolatos konkrét feladat (számpélda) megoldásának bemutatása. 1. Az ábrán látható két jelet mediánszűréssel szűrjük egy 5 pontos mozgóablakkal. A k-dik időpontban a szűrés eredménye, ha a bemenetére kapcsolt jel x(k): ( ) ( ( ) ( ) ( ) ( ) ( )) Mi lesz a mediánszűrés eredménye az x 1 (k) jelre, az x 2 (k) jelre és az x 1 (k)+x 2 (k) jelre, amikor az ábrán megjelölt szakasz esik az ablakba (k=10)? 4 x 2 (k) x(k) Mozgóablak mediánszűrés Ablakhossz: 5 y(k) 2 x 1 (k) 5 10 k -2-4 2. Egy y(k)=x(k)+z(k) jelet mérünk, Az x(k) szinuszos jelsorozat periódusideje K per =7. Az x(k) értékeket sorban becsüljük a teljes periódusra k=1,2,, K per. A mérést torzító z(k) nulla várható értékű (átlaga véges számú zajminta esetén közelít a nullához, ha nagyon sok mintát veszünk, akkor gyakorlatilag nulla) sztochasztikus zaj, amelynek egyes időpontokban az értékei függetlenek egymástól és a jeltől, ezért megfelelő átlagolással csökkenthető a torzító hatása. A következő y(k) sorozatot mértük: k 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 y(k) 1,51 2,63-2,24 0,09-0,66-1,76-0,02 1,31 1,37 2,79-2,12-0,76 0,27 0,35 1,69 k 16 17 18 19 20 21 22 23 24 25 26 27 28 29 31 y(k) 0,59-0,10 0,72 0,43 0,97 1,09-0,24 1,51 1,65-0,28 0,06 0,27 0,11 1,26 0,01 Adja meg ezen mérések alapján x(2) átlagolással javított becslését! 3. Adja meg, hogy az ( ) ([ ( ) ( )]) mozgóablak szűrési eljárás milyen ( ) eredményt ad a k=7 időpontban az ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) bemeneti sorozatra akkor, ha az eljárásunk egyszerű mozgóablak átlagolás, és milyen eredményt ad akkor, ha mozgóablak mediánszűrés! 4. Egy tudottan konstans jelet sokszor megmértünk, és a méréseket átlagoltunk, mert a mérésünk zajjal terhelt. Az első 22 mérés a következő adatsorozatot eredményezte: 13.3147 13.4058 12.6270 13.4134 13.1324 12.5975 12.7785 13.0469 13.4575 13.4649 12.6576 13.4706 13.4572 12.9854 13.3003 12.6419 12.9218 13.4157 13.2922 13.4595 13.1557 12.5357

Ennek alapján a becslésünk 13,1151 volt. Végeztünk egy újabb, huszonharmadik mérést is, ennek eredménye 13,3491 volt. Mennyi az új becslésünk az ismeretlen konstansra? 5. Egy z(k) zajjal terhelt x(k) jelet mérünk, a mért érték: y(k)=x(k)+z(k). A z(k) zaj nulla várható értékű, tehát több mintáját átlagolva nullához tart az átlagérték. (Kevés mintánál még valószínűleg nem nulla, ha sok mintát veszünk, akkor nagy biztonsággal közel nulla.) Egy-egy indító stimulus hatására, a stimulushoz képest 5 időegység késleltetéssel megjelenő 3 időegység széles jelalak érdekel minket. Tehát, ha k=1 időpillanatban indítanánk (stimulálnánk) a rendszert, akkor k=6,7,8 pontokban jelenne meg a minket érdeklő válasz. Három stimulust adtunk a rendszernek k=2, k= 8 és k=15 időpontokban. A következő y(k) sorozatot mértük: k 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 y(k) 0,77 0,04-0,75-0,37-0,53 1,18 0,69-0,13 1,40 0,44 0,38-0,70 0,29-0,26 1,41-0,10 k 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 y(k) 0,71 0,15 0,10 1,79-0,90 1,85 0,42-0,12 0,11-0,58-0,57 0,05 0,36 1,29-0,33 0,09 Adja meg ezen mérések alapján a minket érdeklő 3 időegység széles válaszjel átlagolással javított becslését!

Többdimenziós jelekkel kapcsolatos konkrét feladat (számpélda) megoldásának bemutatása. 1. Az alábbi képen egymás után először egy dilatáció, majd egy erózió műveletet hajtunk végre mindkettőt egy-egy 3x3-as ablakkal. ( A szélső sorokat, oszlopokat nem változtatjuk a műveletek során.) Rajzolja fel az első és a második művelet utáni eredményt! 0 0 0 0 0 0 1 0 1 1 0 0 0 0 0 0 0 0 0 1 1 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 2. Mutassa meg, hogy a 3x3-as ablakkal végzett 2D mediánszűrésre ezen két kép esetén fennáll-e a szuperpozíció! ( A szélső sorokat, oszlopokat nem változtatjuk a szűrés során.) 0 0 0 0 1 0 1 1 0 0 0 0 0 0 0 1 1 0 0 1 0 1 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 1 1 0 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 0 1 0 0 1 1 1 0 0 0 0 0 0 0 1 0 3. Adjon meg 2 olyan 2-dimenziós jelet (képet), amelyre fennáll a 3x3-as ablakkal végzett 2D mediánszűrés elvégzése esetén a szuperpozíció! Adjon meg 2 olyant is, amelyre nem áll fenn!

A ROC görbe analízissel kapcsolatos f feladat (számpélda) megoldásának bemutatása. 1. Előzetes vizsgálatot végeztünk egy diagnosztikus eljárás érzékenységére és specificitására, a megvizsgált 71.218 emberből 33.105 volt egészséges, a többi beteg. A szűrési eljárással összesen 37.321 embert észleltünk betegnek, de közülük csak 33.980 volt ténylegesen az. Ezen előzetes vizsgálat eredménye alapján számolva várhatóan mi lesz a szűrési eljárásunk érzékenysége és specificitása? 2. Eljárásunkat 48.384 fős mintán teszteltük, akik közül 24.192 egészséges, és ugyanannyi a beteg. Egy z paramétert mértünk, és különböző L küszöbértékeknél azt vizsgáltuk, hogy hány egészségesnek és hány betegnek esik L alá a mért z értéke. Ezek után azokat egészségesnek minősítettük, akiknek L alatti a z paramétere, és azokat betegnek, akiknél z L. Rajzolja fel az eljárást jellemző ROC görbét, ha különböző L értékeknél az alábbi táblázatban található valós pozitív (TP) és valós negatív (TN) esetszámokat tapasztaltuk! Jelölje meg a görbén (legalább jellegre helyesen, tehát a 0,3 pont ne a 0,9-nél legyen!) az egyes kiszámolt pontokat, és azt, hogy melyik L értéknél kaptuk azokat! L küszöbszint -100-75 -50-25 0 25 50 75 Az adott L küszöbszinthez tartozó TN esetszám Az adott L küszöbszinthez tartozó TP esetszám 0 3.457 6.914 10.369 13.826 17.282 20.737 24.192 24.19 2 20.735 17.278 13.823 10.366 6.910 3.455 0

A Bayes döntéssel kapcsolatos konkrét feladat (számpélda) megoldásának bemutatása. 1. Az X betegségben a népesség 1,17%-a szenved. Ha a betegséget korai fázisban kezeljük, akkor a kezelés átlagos költsége 23.000 Ft/fő, ha csak a késői fázisában, akkor 843.000 Ft/fő. Két lehetőség közt választhatunk: a) Szűrést végzünk, amelynek költsége 4.000 Ft fejenként, specificitása 0,95; szenzitivitása 0,92. Az itt betegnek vélelmezett embereknél (nyilván akár valóban betegek, akár nem ezt nem tudhatjuk előre) egy további átlagosan 8.000 Ft/fő költségű vizsgálattal eldöntjük, hogy tényleg beteg-e, és csak a tényleg betegnek bizonyult embereket kezeljük. b) Nem szűrünk, hanem mindenkit egészségesnek tekintünk, és vállaljuk, hogy minden beteget majd csak a későbbi fázisban tudunk gyógyítani. A két lehetőség közül melyik kerül a társadalombiztosításnak kevesebb pénzbe? 2. Egy ötmilliós célcsoport szűrésének lehetőségét vizsgáljuk. Az adott betegségben a népesség 0,4%-a szenved. A szűrés költsége fejenként 1.700 forint, tehát ez mindenkinél jelentkezik. Az előzetes vizsgálatok alapján a szűrési eljárás segítségével 83,7% biztonsággal felismerhetők a betegek. Ugyanakkor 12,3%-ban az egészségeseket is betegnek mutatja a vizsgálat, ezt a tévedést csak egy újabb, 8.200 Ft-os kontrollvizsgálattal lehet korrigálni. Ezért ezt a kontrollvizsgálatot minden betegnek diagnosztizáltnál elvégezzük. (Akár valóban betegek, akár csak mi annak tartjuk őket, hiszen nem tudjuk, hogy kik valóban betegek, csak azt tudjuk, hogy a szűrés kiket mutatott annak.) Ha idejében felismerjük a betegséget a szűrés eredményeképpen, akkor a kezelés átlagosan 58.400 forintba kerül. Ha nem ismerjük fel szűréssel idejében a betegséget, és csak később kezdjük el kezelni, akkor az átlagosan 773.000 forintba kerül a kezelés. Mennyi lesz az ezen betegség által okozott egy főre jutó költség, illetve a teljes népességre jutó költség? 3. Testtömegindex (BMI) mérést végzünk: célunk, hogy ennek alapján szűrjük a kóros soványságot. A szűrési eljárás jellemzése céljából összesen 23.417 embert vizsgáltunk meg, akikről tudjuk, hogy kik ebből a szempontból egészségesek, és kik (kórosan sovány) betegek. Összesen 16.917 egészséges van a vizsgált mintában. Megmértük a vizsgálatban résztvevők testtömegindexét, és azt tapasztaltuk, hogy a táblázatban megadott B értékek alatti értéknél az alábbiak szerint alakult a betegek, ezen B értékek feletti értéknél az egészségesek száma. (Persze ez a valóságos szűrés erősen leegyszerűsített, és ezáltal torzított képe ráadásul légbőlkapott adatokkal, szóval csak ROC görbe gyakorlásra jó.) B 8 16 18 20 25 Egészségesek, akiknek B fölé esik a mért BMI-je Kórosan sovány betegek, akiknek B alá esik a mért BMI-je 16.917 16.917 15.863 12.132 0 0 3.879 5.803 6.194 6.500 Rajzolja fel ezen vizsgálat alapján a B-nél kisebb érték esetén beteg, a fölötti értéknél egészséges eljárást jellemző ROC görbét!

A szabályalapú rendszerekben elvégzett következtetésre vonatkozó konkrét megoldásának bemutatása (ítéletkalkulusra szorítkoztunk). feladat (számpélda) 1. Milyen az ítéletkalkulusban megismert formális következtetési lépéseken át juthat el egy tudásbázisú program a G igaz-e? kérdésre adott válaszhoz, ha a tudásbázisában a következő 4 logikai mondatot találjuk, és előrefele következtetést használ: 2. Mutassa meg, hogy a következő két logikai kifejezésnek (mondatnak) azonos az igazságtáblája! (Tehát A és B mindegyik logikai értékkombinációjára pl. IGAZ-IGAZ, IGAZ-HAMIS stb. ugyanazt a logikai eredményt adják) 1. logikai kifejezés: B A 2. logikai kifejezés: (( A) ( B)) 3. Milyen az ítéletkalkulusban ismert formális következtetési lépéseken át juthat el egy tudásbázisú program a D igaz-e? kérdésre adott válaszhoz, ha a tudásbázisában a következő logikai mondatokat találjuk, és hátrafele következtetést használ:

A döntési fa kifejtésével kapcsolatos konkrét feladat (számpélda) megoldásának bemutatása. 1. Egy négyosztályos (egészséges/betegség1/betegség2/betegség3) osztályozási problémát akarunk megoldani döntési fa segítségével. A gyökér csomópontba 12.000 (3.000-3.000 minden csoportból) mintát tudtunk gyűjteni. Az ábrán az összes csomópont mellett (a csomópont jobb oldalán) látható (vagy ahol nincs, ott kiszámítható) négy szám: az első az egészségesekhez, a második az első betegcsoporthoz, a harmadik a második betegcsoporthoz, a negyedik a harmadik betegcsoporthoz tartozó, odajutó minták száma. Az alábbi teszt alkalmazását vizsgáltuk meg a gyökér csomópontban. Megadtuk a gyermek csomópontokba jutó minták számát, és az egészséges/beteg1/beteg2/beteg3 eloszlást. Mekkora lesz a teszt alkalmazása során elért információnyereség, illetve az információnyereség arány? Teszt [3000,3000,3000,3000] A1 [300,300,300,300] A2 [100,100,2600,100] A3 2. Egy kétosztályos (egészséges/beteg) osztályozási problémát akarunk megoldani döntési fa segítségével. A gyökér csomópontba 6000 (3000 egészséges + 3000 beteg) mintát tudtunk gyűjteni egy vizsgálatot elvégezve. Az ábrán az összes csomópont mellett (a csomópont jobb oldalán) látható vagy kiszámítható két szám: az első az egészségesekhez, a második a betegekhez tartozó, odajutó minták száma. Az alábbi két teszt alkalmazását vizsgáltuk meg a gyökér csomópontban. Mindkét tesztnél megadtuk a gyermek csomópontokba jutó minták számát, és az egészséges/beteg eloszlást. Az első tesztnél 3 gyermek csomópont jött létre (a harmadikhoz, az A3 gyermekcsomóponthoz tartozó eloszlás egyszerűen kiszámítható!). A második tesztnél 10 gyermek csomópont jött létre, ahol 5-5 azonos mintaeloszlást mutat. (A B1 B5 csomópontok mintaeloszlása egyforma, és ettől eltérő, de a második csoporton belül egyforma a B6 B10 csomópontokba jutó minták eloszlása). Melyik teszt alkalmazását javasolná inkább, ha pusztán az információnyereséget vizsgálja, és melyiket, ha az információnyereség arány alapján dönt? Teszt-A esetén: Gy [3000,3000] Teszt-B esetén: Gy [3000,3000] A1 [2700,300] A2 [100,900] A3 B1 [600,0] B5 [600,0] B6 [0,600] B10 [0,600]

A megoldás visszametszésével kapcsolatos konkrét feladat (számpélda) megoldásának bemutatása. 1. Az alábbi ábrán egy 8000 minta alapján tanítással előállított döntési fa látható. A csomópontok mellett, mindig tőlük jobbra, bekeretezve szögletes zárójelben látható két szám, ez a C1, illetve C2 osztályba jutó tanítóminták száma az adott csomópontban. Mind az osztályozás hibaaránya, mind az eszköz komplexitása költséget jelent nekünk. A döntési fával elérhető osztályozás hibaarányának százszorosa az ezzel kapcsolatos költségünk. (Ha a hibaarány 0, akkor a költségünk is 0, ha a hibaarány 1, akkor 100 a költség, ha pl. a hibaarány 0,5 a megfelelő költségünk 50 lenne.) A szokásos módon meghatározott komplexitás 6 költséget okoz nekünk levelenként. Érdemes-e felhasználnunk a döntési fát, vagy jobban járunk, ha egyszerűen bezárjuk a gyökér csomópontot, és a gyökér csomópontot levélnek tekintve adjuk meg az osztályba sorolásra a választ? 1 [3000,5000] 2 [1000,4000] 5 [2000,1000] 3 [990,10] 4 [10,3990] 6 [650,15] 7 [1350,985] 2. Az alábbi ábrán egy 12.000 minta alapján tanítással előállított döntési fa látható. A csomópontok mellett, mindig tőlük jobbra bekeretezve szögletes zárójelben látható két szám, ez a C1, illetve C2 osztályba jutó tanítóminták száma az adott csomópontban. Mind az osztályozás hibaaránya, mind az eszköz komplexitása költséget jelent nekünk, az egységnyi komplexitás növekedés 10-szer akkor költség, mint az egységnyi hibaarány növekedés. Két csomópont bezárása merült fel: a 8-as vagy a 2-es csomópontot érdemes bezárnunk a hibaarány-komplexitás kompromisszum elvét használva? 1 [3000,9000] 2 [500,4000] 8 [2500,500] 17 [0,4500] 3 [400,100] 4 9 [100,3900] [1145,120] 10 [1355,380] 5 [80, 20] 6 [0,580] 7 [20,3300] 11 [5,100] 12 [1350, 80] 13 [0, 200]