BUDAMED 05 Konferencia Orvosbiológiai és Klinikai Mérnököknek, október 13, Budapest.

Hasonló dokumentumok
Halláskárosodás elemzése

OTKA T Biológiai jelek információinak diagnosztikai célú kutatása rendszerelméleti megközelítéssel

CSECSEMŐK HANGELEMZÉSE KÜLÖNÖS TEKINTETTEL HALLÁS-KÉPESSÉGÜKRE

Hibadetektáló rendszer légtechnikai berendezések számára

Budapesti Műszaki és Gazdaságtudományi Egyetem Villamosmérnöki és Informatikai Kar Villamosmérnöki Tudományok Doktori Iskola.

Al-Mg-Si háromalkotós egyensúlyi fázisdiagram közelítő számítása

2. Az emberi hallásról

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

Grafikonok automatikus elemzése

Útjelzések, akadályok felismerése valós időben

A magánhangzó-formánsok és a szubglottális rezonanciák összefüggése a spontán beszédben

AKTUÁTOR MODELLEK KIVÁLASZTÁSA ÉS OBJEKTÍV ÖSSZEHASONLÍTÁSA

MATLAB. 5. gyakorlat. Polinomok, deriválás, integrálás

Fourier-sorok. Lengyelné Dr. Szilágyi Szilvia április 7.

Élpont osztályozáson alapuló robusztus tekintetkövetés

VALÓS HULLÁMFRONT ELŐÁLLÍTÁSA A SZÁMÍTÓGÉPES ÉS A DIGITÁLIS HOLOGRÁFIÁBAN PhD tézisfüzet

Orvosi Fizika és Statisztika

Generátor differenciálvédelmi funkció blokk leírása

Mérési hibák

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

ÉRZÉKELŐK ÉS BEAVATKOZÓK I. 3. MÉRÉSFELDOLGOZÁS

Balatonőszöd, június 13.

Irányítási struktúrák összehasonlító vizsgálata. Tóth László Richárd. Pannon Egyetem Vegyészmérnöki és Anyagtudományok Doktori Iskola

BDLD. Négyszög könyök hangcsillapító. Méretek

Alállomási és oszlopföldelési ellenállásmérés és diagnosztika

Tanulási cél Szorzatfüggvényekre vonatkozó integrálási technikák megismerése és különböző típusokra való alkalmazása. 5), akkor

Elektromos nagybıgı megvalósítása DSP-vel

GÉPI ÉS EMBERI POZICIONÁLÁSI, ÉRINTÉSI MŰVELETEK DINAMIKÁJA

Teljesítményprognosztizáló program FELHASZNÁLÓI KÉZIKÖNYV

Külső fül: Középfül: Belső fül:

A PhysioBank adatmegjelenítő szoftvereinek hatékonysága

Fuzzy rendszerek és neurális hálózatok alkalmazása a diagnosztikában

Idő-frekvencia transzformációk waveletek

Négyszög egyenes hangcsillapító DLD. Méretek

STATISZTIKAI PROBLÉMÁK A

Mintavétel: szorzás az idő tartományban

Jelek és rendszerek 1. 10/9/2011 Dr. Buchman Attila Informatikai Rendszerek és Hálózatok Tanszék

Kontrollcsoport-generálási lehetőségek retrospektív egészségügyi vizsgálatokhoz

3/29/12. Biomatematika 2. előadás. Biostatisztika = Biometria = Orvosi statisztika. Néhány egyszerű definíció:

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés

Mérési struktúrák

Nehézségi gyorsulás mérése megfordítható ingával

Regresszió számítás. Tartalomjegyzék: GeoEasy V2.05+ Geodéziai Kommunikációs Program

1. ábra. Repülő eszköz matematikai modellje ( fekete doboz )

A KUTATÁS EREDMÉNYEI ZÁRÓJELENTÉS

Baranyáné Dr. Ganzler Katalin Osztályvezető

MÉSZÁROS JÓZSEFNÉ, NUMERIKUS MÓDSZEREK

ICT ÉS BP RENDSZEREK HATÉKONY TELJESÍTMÉNY SZIMULÁCIÓJA DR. MUKA LÁSZLÓ

Információ megjelenítés Diagram tervezés

Neurális hálózatok bemutató

Akusztikai tervezés a geometriai akusztika módszereivel

CARE. Biztonságos. otthonok idős embereknek CARE. Biztonságos otthonok idős embereknek Dr. Vajda Ferenc Egyetemi docens

X. ANALÓG JELEK ILLESZTÉSE DIGITÁLIS ESZKÖZÖKHÖZ

Transzformátor rezgés mérés. A BME Villamos Energetika Tanszéken

Numerikus Matematika

Szinkronizmusból való kiesés elleni védelmi funkció

BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Elengedhetetlen a játékokban, mozi produkciós eszközökben Nélküle kvantum hatás lép fel. Az objektumok áthaladnak a többi objektumon

Méréselmélet és mérőrendszerek 2. ELŐADÁS (1. RÉSZ)

ÁRAMKÖRÖK SZIMULÁCIÓJA

A HANGOK TANÁTÓL A BESZÉDTECHNOLÓGIÁIG. Gósy Mária. MTA Nyelvtudományi Intézet, Kempelen Farkas Beszédkutató Laboratórium

Fourier-sorfejtés vizsgálata Négyszögjel sorfejtése, átviteli vizsgálata

Pacemaker készülékek szoftverének verifikációja. Hesz Gábor

DIGITÁLIS TEREPMODELL A TÁJRENDEZÉSBEN

Számítógépes Grafika SZIE YMÉK

Posztanalitikai folyamatok az orvosi laboratóriumban, az eredményközlés felelőssége

Értékelés Összesen: 100 pont 100% = 100 pont A VIZSGAFELADAT MEGOLDÁSÁRA JAVASOLT %-OS EREDMÉNY: EBBEN A VIZSGARÉSZBEN A VIZSGAFELADAT ARÁNYA 35%.

A regisztrált álláskeresők számára vonatkozó becslések előrejelző képességének vizsgálata


Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Mérési útmutató a Mobil infokommunikáció laboratórium 1. méréseihez

ELTE TáTK Közgazdaságtudományi Tanszék MAKROÖKONÓMIA. Készítette: Horváth Áron, Pete Péter. Szakmai felelős: Pete Péter

Fázisátalakulások vizsgálata

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Gyakorló többnyire régebbi zh feladatok. Intelligens orvosi műszerek október 2.

Statisztikai módszerek a skálafüggetlen hálózatok

Maple: Deriváltak és a függvény nevezetes pontjai

RC tag mérési jegyz könyv

A/D és D/A átalakítók gyakorlat

Optikai méréstechnika alkalmazása járműipari mérésekben Kornis János

Scan 1200 teljesítmény-értékelés evaluation 1/5

Lineáris regresszió vizsgálata resampling eljárással

Sztereó kamerarendszerre alapozott gyalogos felismerés Kornis János*, Szabó Zsolt**

Villamos jelek mintavételezése, feldolgozása. LabVIEW 7.1

Segédlet: Főfeszültségek meghatározása Mohr-féle feszültségi körök alkalmazásával

A KLT (Kanade Lucas Tomasi) Feature Tracker Működése (jellegzetes pontok választása és követése)

A 2017/2018. tanévi Országos Középiskolai Tanulmányi Verseny döntő forduló FIZIKA II. KATEGÓRIA JAVÍTÁSI ÚTMUTATÓ. Pohár rezonanciája

Mikroszkóp vizsgálata Folyadék törésmutatójának mérése

Minőségmenedzsment (módszerek) BEDZSULA BÁLINT

A mintavételezéses mérések alapjai

(Forrás:

A tanulók gyűjtsenek saját tapasztalatot az adott szenzorral mérhető tartomány határairól.

DLDY. Négyszög egyenes hangcsillapító. Méretek

Függőleges. Vízszintes

MODULATOR Számítógépes program Commodore 64-re a párhuzamos rezgések összetételének tanulmányozására

Beszédátvitel a GSM rendszerben, fizikai és logikai csatornák

y ij = µ + α i + e ij

Rendszer szekvencia diagram

R5 kutatási feladatok és várható eredmények. RFID future R Király Roland - Eger, EKF TTK MatInf

Átírás:

BUDAMED 05 Konferencia Orvosbiológiai és Klinikai Mérnököknek, 2005. október 13, Budapest. SZÁMÍTÓGÉPES MÓDSZEREK A CSECSEMŐSÍRÁSOK DALLAMÁNAK DETEKTÁLÁSÁRA, MEGJELENÍTÉSÉRE ÉS KIÉRTÉKELÉSÉRE Gy. Várallyay * Jr., Z. Benyó *, A. Illényi **, Zs. Farkas *** * Budapesti Műszaki és Gazdaságtudományi Egyetem, Irányítástechnika és Informatika Tanszék, Orvosi Informatika Laboratórium, 1117 Budapest, Magyar tudósok krt. 2. ** BME Távközlési és Médiainformatikai Tanszék, 1117 Budapest, Magyar tudósok krt. 2. *** Heim Pál Gyermekkórház, 1089 Budapest, Üllői út 86. varallyay@bio.iit.bme.hu Absztrakt Sokféle okból sírhatnak a csecsemők, de a sírás vizsgálatával nemcsak a babák lelkiállapotáról, hanem élettani kondíciójáról is információt szerezhetünk. Megfelelően megválasztott sírásparaméterek elemzésével lehetőség nyílhat egy sírási hang alapján történő diagnosztikai rendszer létrehozására. A sírás dallama egy olyan jellegzetes sírásparaméter, mely kapcsolatban áll mind a sírás okával, mind különböző betegségekkel. Tehát a dallam megbízható kiszámítása, ábrázolása, valamint kiértékelése a csecsemősírás elemzésének fontos része. Munkánkban olyan algoritmusokat mutatunk be, melyek lehetővé teszik a dallam szubjektív és objektív osztályozását is. Továbbá egy olyan javító algoritmust ismertetünk, mely kiszűri az emberi halláshoz hasonlóan a sírás dallamában lévő zavarokat. Kulcsszavak csecsemősírás, alapfrekvencia-detektálás, sírás dallama, dallamkottázás, dallamjavítás Bevezetés A csecsemősírás értékes információforrás a csecsemőről. Ez a csecsemő első kommunikációs eszköze, ezzel fejezi ki eleinte kevésbé majd egyre tudatosabban fájdalmát, szándékát, igényeit. A csecsemősírás nemcsak tudatos kifejezőeszköz, hanem egyben élettani jel is, mely többek között a csecsemő légzéséről, hangképzéséről ad tájékoztatást [1-3]. Például másképp sír a csecsemő, amikor torokgyíkja van; a Down-kóros csecsemőkre az erőtlen, vékony, nyekergő felsírási hang a jellemző [4]. Mivel a sírási hang, mint élettani jel, detektálása egyszerűen, non-invazív úton történik, így felvetődik a kérdés: használható-e a csecsemősírás elemzése a diagnosztikában? Hazánkban Hirschberg vizsgálta évtizedeken keresztül a sírás és a különféle csecsemőkori betegségek közti kapcsolatot [5]. Hirschberg szerint a fonetikailag iskolázott fül számos eltérés kimutatására alkalmas [6]. Ha létezik egyes betegségekre akusztikailag eltérő karakterisztikájú sírás, ezeket a különbségeket számítógépes elemzéssel is lehet detektálni, és a gyakorlott orvosok szubjektív módszerét egy objektív diagnosztikai módszerré lehet kiterjeszteni. A csecsemősírásnak számos olyan paramétere van, mely lehetővé teszi az egyes sírások kvalitatív és kvantitatív összehasonlítását. Ilyenek például a sírások hossza, a sírások közti szünetek hossza, az alapfrekvencia átlagos értéke, a felharmonikusok eloszlása vagy a sírás dallama. Ebben a tanulmányban a sírás dallamának detektálására, megjelenítésére és kiértékelésére alkalmas számítógépes módszereket mutatunk be. A sírás dallama A sírás dallama, a sírási alapfrekvencia időbeli változásának megjelenítésével kapható meg. Kiértékelése más kutatócsoportok esetében szubjektíven történt, azaz a kirajzolt dallamokat vagy spektrogramokat a kutatók szabad szemmel (hasonlóan a hirschbergi iskolázott fülhöz ) összevetették, és akként sorolták be csoportokba. A sírás dallama több kutatócsoport beszámolója alapján kapcsolatban áll a sírás okával, míg mások arról tájékoztatnak, hogy egyes betegségek hosszú, elnyújtott dallamot eredményeznek [7-8]. Tehát a sírási hang alapján történő diagnosztikai rendszer egy alapvető része a sírás dallamának meghatározása és kiértékelése is. Schönweiler az alábbi csoportosítást vezette be a sírások dallamára (1. ábra). emelkedő-eső eső-emelkedő eső lapos emelkedő felpattanó 1. ábra. Sírásdallamok Schönweiler nyomán [9]. Láthatóan az előbb említett kutatócsoport egyszerű kategóriákat határozott meg, melyek jellegükben eltérőek. Hamarosan megmutatjuk, hogy ennél sokkal változatosabb dallamok is léteznek, melyeket egy spektrogramról nehezebben lehetne szabad szemmel leolvasni. Módszer Jelen munkánkhoz 158 csecsemő sírásfelvételét használtuk fel, melyekben összesen 1361 sírásjelet vizsgáltunk. A hangfelvételek a Heim Pál Gyermekkórházban

készültek hallásvizsgálat közben, mely során a csecsemő a szülő ölében ült, míg az orvos a füleit vizsgálta. Ez az eljárás többnyire fájdalmas volt a csecsemő számára, így elkezdett sírni. SONY DCR-TRV25 típusú digitális videokamerát használtunk a hang és a kép rögzítésére. Kutatócsoportunk csak a hanginformáció elemzésével foglalkozik, a kép, mint kiegészítő információ áll rendelkezésre. A kamera és a síró baba közti távolság kb. 2 méter volt. A hangjel digitalizálását a kamera végezte 48 khzes mintavételi frekvenciával, mintánként 16 biten, 1 sávban. Nemrég kiderült, hogy az általunk alkalmazott digitális kamera egy kikapcsolhatatlan, automatikus dinamikaszabályzót is tartalmaz, mely legtöbb esetben kismértékben torzította a bemeneti hangjelet. Ezért a közeljövőben áttérünk egy e célra létrehozott adatgyűjtő szoftver alkalmazására, mely megbízható hangfelvételi és adatbáziskezelő tulajdonságokkal rendelkezik. Az új adatgyűjtéshez csatlakozik a Miskolci Megyei Kórház is, így reményeink szerint az elkövetkező hónapokban újabb, százas nagyságrendű adatbázist hozhatunk létre. A sírás dallamának detektálása Mivel az alapfrekvencia értékét nem befolyásolják a harmonikus torzítások, így a régi adatállományon vizsgálhatóak a dallammal kapcsolatos számítógépes módszerek. A dallam meghatározásának több módja van, a számítási idő lecsökkentése érdekében mi egy olyan módszert alkalmaztunk, mely nem pontról-pontra, hanem ablakonként vizsgálja az alapfrekvencia értékét (lásd 2. ábra). Ahhoz, hogy az alapfrekvencia ablakokon belüli változását elhanyagolhatónak tekintsük, szükséges, hogy kellően kis méretű ablakokat válasszunk. Ezzel szemben, a számítási idő lecsökkentése miatt érdemes kevesebb, tehát nagyobb méretű ablakokat választani. E két feltétel kompromisszumaként az ablakhosszra kb. 50 ms adódik. Az ablakokra bontással és az ablakokon belüli változások elhanyagolásával jeltömörítést is végeztünk. Például egy 1 s hosszúságú sírásjel dallamát (50 ms-os ablakmérettel számolva) 20 ponttal le tudjuk írni. Ennél finomabb felbontásra nincsen szükség, a sírás dallamának jellege ebből már megállapítható. frekvencia érték között a kapcsolatot hányadosuk jellemzi, így célszerű logaritmikus ábrázolást használni a dallam megjelenítéséhez. Az alapfrekvencia értéke saját és mások megfigyelései alapján kb. 330 és 700 Hz között változik [10-12]. Több évtizeddel ezelőtt egy magyar kutatócsoport ötvonalas kottapapíron ábrázolta (lásd 3. ábra) a csecsemősírás dallamát [13]. A kottázást egy abszolút hallással rendelkező munkatárs végezte. Ez a módszer, bár szubjektív, mégis jól érzékeltette a dallamok jellegét, hosszát, illetve abszolút helyzetét (azaz könnyen látható, hogy mélyebb vagy magasabb hangon sír a csecsemő). Mivel a kottapapír alsó vonalához tartozó hang frekvencia-értéke 329.63 Hz és a felső vonalához tartozó hang frekvenciája 698.46 Hz, így ez az ábrázolásmód megfelelő intervallumot biztosít a csecsemősírás alapfrekvenciájának megjelenítésére. A klasszikus módszer hátránya, egyrészt szubjektív mivolta, azaz nem reprodukálhatóak pontosan az eredmények illetve a megjelenítéshez használt ötvonalas kottapapír egy szabálytalan frekvenciaskálázásnak felel meg. 3. ábra. Klasszikus dallamábrázolási módszer. Munkacsoportunk az előnyök megtartásával átdolgozta a klasszikus módszert a dallam ábrázolásához. Az új módszer (FLM Five Line Method) úgy módosította a klaszszikus kottapapír öt vonalának frekvenciaértékeit, hogy az megfeleljen egy szabályos, logaritmikus skálázásnak [14-15]. Az új módszer egy további előnye, hogy objektív. Az FLM módszerre a 4. ábra mutat néhány példát. A sírás dallamának ábrázolása Az ablakonként detektált alapfrekvencia-értékek időtartománybeli ábrázolásával kapjuk a dallamot. Mivel két f [Hz] 600 400 200 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 1. 507,16 Hz 2. 531,00 Hz 3. 526,66 Hz 4. 506,06 Hz 5. 495,22 Hz 6. 506,06 Hz 7. 507,16 Hz 8. 495,22 Hz 9. 498,48 Hz 10. 487,64 Hz 11. 469,22 Hz 12. 448,62 Hz 13. 424,76 Hz 250 500 750 t [ms] 2. ábra. Az alapfrekvencia időbeli változásának (dallam), valamint a sírásjel ablakokra bontásának szemléltetése. 4. ábra. Néhány példa a klasszikus ábrázolásmód átdolgozásából kapott FLM módszerre.

A vízszintes tengelyen az idő (0-2 s intervallumban), a függőleges tengelyen a frekvencia szerepel (logaritmikus skálázással). Ebből a néhány példából is látható, hogy az 1. ábrán bemutatott dallamképekhez képest sokkal változatosabb sírásdallamok is léteznek. A sírás dallamának kiértékelése A bevezetőben említett, szabad szemmel történő dallamösszehasonlításnak, kiértékelésnek számos hátránya van: szubjektív módszer (nem reprodukálható), koncentrációt igényel, pontatlan, csak néhány tipikus dallam eltérését észleli, bizonyos számú összehasonlítás után pihenőt kell tartani. Célszerű egy olyan módszert alkalmazni, mely nem tartalmazza a fenti negatívumokat. Két módszert javaslunk a dallamok összehasonlításához, az egyik a derivált figyelése, a másik a polinommal való közelítés. Az időben változó dallam deriváltjának vizsgálatával egyszerű kritériumot kapunk arra, hogy a sírás dallama éppen melyik fázisban van (azaz emelkedő, lapos, vagy eső) [16]. Ezzel a módszerrel felismerhetőek az egyszerűbb sírásdallamok. A másik lehetőség, ha a sírás dallamát egy bizonyos fokszámú polinommal közelítjük. A Matlab polyfit utasítása a bemenetül kapott sírásdallamot úgy közelíti egy polinommal, hogy az eredeti és a közelített pontok közti differencia négyzete minimális legyen. Ezek után az egyes sírásokat jellemző polinomok együtthatóit kell összehasonlítani egymással, vagy hozzárendelhetők tipikus dallamokhoz tipikus együttható-kombinációk és aszerint osztályozhatjuk a dallamokat. Egy példán át bemutatva fenti két módszert, adott egy sírásdallam, melynek deriváltját az 5. ábra mutatja. Ugyanezt a dallamot a következő hatodfokú polinom nagyon kicsi hibával közelíti meg: ( k) M a6k a6 = 336 a1 = 12902 a = 381 0 6 + a5k + a4k + a3k + a2k a5 = 2687 a4 = 8405 a = 9864 a = 3126 2 5 4 3 3 2 + a k + a A fenti összefüggésből láthatjuk, hogy ez az eljárás tovább tömöríti a dallam leírását. Jelen példában az előző ábráról is leolvasható mintegy 50 pont helyett e módszer alkalmazásával már csak 7 pont szükséges a teljes dallam leírásához. Az együtthatók nagy méretét a két dimenzió (idő és frekvencia) közti 2-3 nagyságrendbeli eltérés magyarázza. Javító algoritmus Számos zajforrás szerepel a korábbiakban leírt hangfelvételi láncban, melyek kiküszöbölése különböző előfeldolgozási eljárásokkal oldható meg. Ilyen például a háttérzaj, mely hatása egy megfelelő felüláteresztő szűrő alkalmazásával lecsökkenthető. A csecsemő maga is lehet zavarforrás. Például, ha sírás közben rekedt a hangja, akkor nem detektálható az alapfrekvencia (vagyis nem jó értéket detektálunk: detektálási hiba), így nincsen dallam sem. Számos olyan sírás is előfordul, melyek nagy részében normális hangon sír a baba, de egyes helyeken rekedtes a hangja. Az emberi hallás integráló tulajdonsággal is bír. Például, ha egy telefonbeszélgetésben időnként kis időtartamú sercegések vagy kimaradások vannak, a telefonáló felek még tökéletesen értik egymást. Így van ez a sírás esetében is: ha sírás közben egy rövid időre rekedtes hangja van a csecsemőnek, az agyunkban mégis folyamatos sírásdallamot észlelünk. A 6. ábra néhány olyan valós esetet mutat be, ahol a kapott dallamban tévesen detektált alapfrekvencia értékek is szerepelnek. 1 0 5. ábra. A sírás dallamának és deriváltjának szemléltetése. A derivált dallamfüggvény (dm/dt) vizsgálatából kiderül, hogy a dallam (M) kb. 0.3 s-ig emelkedik (dm/dt > 0), majd a legvégéig csökken (dm/dt < 0). Bonyolultabb dallamok felismerése is megvalósítható a derivált vizsgálatával, logikai szabályrendszer alkalmazásával. 6. ábra. Sírásdallamok tévesen detektált alapfrekvencia értékekkel. Az első képen 0.4 s körül található egy rosszul detektált alapfrekvencia érték. A második képen a sírás elején egy

szakaszon a jóhoz képest egy oktávval lejjebb találhatóak detektált értékek (ennek oka a kicsit érces hang lehet). A harmadik és a negyedik képen feltehetően rekedtség miatt a sírás közepén több tévesen detektált alapfrekvencia érték szerepel. Több olyan sírásparaméter van, mely a detektált dallamból származtatható [17]. Hibás dallam esetén halmozódik a detektálási hiba, a többi sírásjellemző is téves eredményt fog mutatni. Ezt elkerülendő, két lehetőség van: a hibás dallamú sírás eldobása, vagy a dallam kijavítása. Az előbbi megoldás azért nem megfelelő, mivel a sírások komoly hányada tartalmaz detektálási hibát, így célszerű valamilyen javító algoritmust alkalmazni. Kutatócsoportunk olyan javító algoritmust dolgozott ki, mely a tévesen detektált alapfrekvencia értéket a megfelelően detektált értékek alapján korrigálja. Az eljárás iterációs lépésekkel minimalizálja a dallamhoz hozzárendelt költségfüggvényt a hibásnak vélt pontok korrigálásával, és végeredményül a javított dallamot adja. A javító algoritmus alapja a detektált dallam szomszédos pontjai közti távolság vizsgálata. Egy meghatározott küszöbszintnél nagyobb szomszédság esetén a jónak feltételezett ponthoz korrigálja a rossznak feltételezett pontot. Eredmények Jelen munkánkban nem végeztünk összehasonlító elemzéseket különböző csecsemőcsoportok sírásai között, a sírásjeleket a számítógépes módszerek tesztelésére használtuk fel. A kapott eredmények a javító algoritmus szükségességét mutatják. A dallam detektálása Az 1361 sírásjelet összesen 32270 ablakra lehetett felbontani, azaz ennyi alapfrekvencia-detektálás történt összesen. Átlagosan egy sírásjel 24 ablakból állt (50 ms-os ablakmérettel számolva az átlagos síráshossz 1.2 s volt). Az 1361 sírásjelből mindössze 507 dallam esetében nem volt egy detektálási hiba sem. A többi (854) sírásban egy vagy több helyen megszakadt a detektált dallam folytonossága a csecsemősírás zavarainak következtében. A dallam javítása E sérült dallamok jelentős részét a javító algoritmussal korrigálni tudtuk. Az algoritmus egy olyan matematikai műveletsor, amit a program minden dallamra végrehajt. Vannak olyan dallamok is, amelyek olyan sok hibás alapfrekvencia-értéket tartalmaznak, hogy nehéz automatikusan megállapítani, hogy a detektált értékek közül melyik helyes és melyik téves. Célszerű definiálni egy kritériumot, mellyel felismerhető a sok hibát tartalmazó dallam. A javító algoritmus jelenlegi verziójában azt a kritériumot határoztuk meg, hogy ha a dallam pontjai számának több mint egyharmadát javította az algoritmus, akkor azt a javított dallamot a program ne tekintse megfelelőnek. E kritérium figyelembevételével a hibátlan 507 dallam mellé 566 javított dallamot szereztünk, azaz több mint kétszer annyi dallamot vizsgálhatunk, mint amit eredetileg hibamentesen detektáltunk. A dallamjavításból származó eredményeket mutatja az 1. táblázat. 1. táblázat. A dallamjavításból származó eredmények Megnevezés Sírások száma 1361 Hibamentes dallamok száma 507 Javított dallamok száma 566 Eldobott dallamok száma 288 Mennyiség Összes sírás ablakainak száma 32270 Felhasznált 1073 sírás ablakainak száma 24194 Ebben a téves detektálások száma 1655 Láthatóan a téves detektálások száma (1655) a felhasznált ablakok (24194) számának 6.84 %-át tették ki, azaz elmondható, hogy átlagosan egy sírás 7 %-ában rekedt, érces hangon sír a csecsemő, vagy egyéb zavaró jelenségek lépnek fel a sírási hangban. A javító algoritmusban alkalmazott kritérium erős megkötést adott. Több olyan tévesen detektált dallamot is megfelelően javított az algoritmus, melyeket a kritérium alapján a program nem talált elfogadhatónak. Egy hatékonyabb javító algoritmus vagy egy megfelelőbb kritérium megválasztásával még több sérült dallamot lehetne kijavítani. A dallam polinommal való közelítése Tapasztalataink alapján az esetek döntő többségében a hatodfokú polinommal való közelítés már nagyon kicsi hibával közelítette meg a dallamokat. A nagyon hosszú, (2 másodpercnél hosszabb, azaz több mint 40 ablakból álló) sírásjelek esetében előfordultak olyan dallamok, melyeknél a hatodfokú polinommal való közelítés fokszáma nem bizonyult elegendőnek. Leírás A csecsemősírás egyik fontos jellemzője a dallama. A spektrogramról szabad szemmel leolvasott alapfrekvencia változások csak a jellegzetesebb dallamformák leírását tették lehetővé. Láthatóan ezeknél sokkal változatosabb dallamformák is léteznek. A sírás dallamának detektálása az alapfrekvencia időbeli változásának vizsgálatának felel meg. A számítási idő lecsökkentése érdekében célszerű a mintavételi időnél nagyobb időközönként meghatározni a sírás alapfrekvenciáját. A detektált dallam alapján számos sírásparaméter meghatározható (pl. átlagos alapfrekvencia, emelkedési idő, dallamforma), melyeket reményeink szerint egyes csecsemőkori betegségek diagnosztizálásánál lehet alkalmazni. A fent leírt eljárásunk a bementen kapott sírásjelből minden külső beavatkozás nélkül, automatikusan határozza meg a sírás dallamát. Munkánk aktuális fázisában ezt az automatizált rendszert tesszük még robusztusabbá és hatékonyabbá. Az automatikus jelfeldolgozási egység kimenete a detektált és javított dallam, valamint átlagértékek, ellenőrző hibafüggvények értékei és a polinomos közelítés együtthatói.

Következtetések A dallamok ötvonalas kottázása lehetővé teszi, hogy a kapott ábráról könnyen leolvasható legyen a hangmagasság, a dallam frekvenciaátfogása, stb. Az egyértelműen definiált frekvenciaértékű öt vonalhoz sokkal könnyebben viszonyítható a sírás változó alapfrekvenciája. A dallamdetektáló és megjelenítő rendszerünk fontos összetevője a dallamjavítás. Az általunk megvalósított javító algoritmus az 507 hibátlan dallam mellé 566 javított dallamot adott a további elemzéshez, azaz az elemezhető dallamok 52 %-át a javító algoritmus biztosította. Az emberi hallás kompenzálja a folytonos sírásban jelenlevő kisebb zavarokat, és folyamatos dallamnak érzékeli a sírást. A hallás e tulajdonságára hasonlító dallamjavítás lehetővé teszi, hogy a számítógép által detektált és a hallott dallam közti különbség lecsökkenjen. A polinomos dallamközelítés révén néhány paraméterrel le tudjuk írni egy 1-2 másodperces sírás dallamát. A tömörítéssel könnyebben megvalósítható egy olyan dallamelemző rendszer, amiben a távoli felhasználó csupán a sírásparamétereket küldi el elektronikusan, s nem szükséges az eredeti sírásjel összes, több százezer redundáns pontját elküldeni. Köszönetnyilvánítás Kutatásainkat az Országos Tudományos Kutatási Alapprogram (OTKA: T029830, T042990) és az Egészségügyi Tudományos Tanács (ETT: 089/2003) támogatja. Referenciák [1] R. G. Barr, B. Hopkins, J. A. Green, Crying as a sign, a symptom and a signal, Clinics in Dev. Medicine No. 152. London, MacKeith Press (2000) [2] G. Várallyay Jr., Z. Benyó, A. Illényi, Z. Farkas, G. Katona, Z. Csákányi, T. Majoros, P. Benedek, T. Patkó, Csecsemősírás számítógépes elemzése. Proc. BUDAMED 02, Budapest, pp. 60-61. (2002) [3] Z. Benyó, Z. Farkas, A. Illényi, G. Katona, G. Várallyay Jr., Csecsemők hangelemzése különös tekintettel a hallásképességükre. In: Beszédkutatás 2002. Edited: Gósy Mária. MTA Nyelvtudományi Intézet, Budapest, pp. 100-117. (2002) [4] J. Hirchberg, T. Szende, Pathological cry, stridor and cough in infants, Akadémiai Kiadó, Budapest (1982) [5] J. Hirschberg, P. H. Dejonckere, M. Hirano, K. Mori, H-J. Schultz-Coulon, K. Vrticka, Voice disorders in children, Int J Pediatr Otorhinolaryngol, Vol. 32. pp. S109-S125. (1995) [6] J. Hirschberg, A foniátria és a Magyar Fonetikai, Foniátriai és Logopédiai Társaság története. A kommunikáció, a hangképzés és a beszéd zavarainak kezelése, Rétiron Kft, Budapest, pp. 163-207 (2003) [7] K. Michelsson, K. Eklunkd, P. Leppanen, H. Lyytinen, Cry characteristics of 172 healthy 1- to 7- day-old infants, Folia Phoniatr Logop, Vol. 54. No. 4. pp. 190-200 (2002) [8] G. Várallyay Jr., Future prospects of the application of the infant cry in the medicine, Periodica Polytechnica Ser. El. Eng. in press [9] R. Schönweiler, S. Kaese, S. Möller, A. Rinscheid, M. Ptok, Neuronal networks and self-organizing maps: new computer techniques in the acoustic evaluation of the infant cry, Int J Pediatr Otorhinolaryngol, Vol. 38. pp. 1-11. (1996) [10] Z. Benyó, Z. Farkas, A. Illényi, G. Katona, G. Várallyay Jr., Information transfer of sound signals. A case study: the infant cry. Is it a noise or an information?. Proc. 33rd International Congress and Exposition on Noise Control Engineering, Prague, No. 528. pp. 1-8. (2004) [11] K. Michelsson, K. Christensson, H. Rothganger, J. Winberg, Crying in separated and non-separated newborns: sound spectrographic analysis, Acta Paediatr, Vol. 85. No. 4. pp. 471-475. (1996) [12] K. Wermke, W. Mende, C. Manfredi, P. Bruscaglioni, Developmental aspects of infant s cry melody and formants, Med Eng Phys, Vol. 24. No. 7-8. pp. 501-514. (2002) [13] Z. Makói, Z. Szőke, L. Sasvári, P. Gegesi Kiss, P. Popper, 1st cry of newborn after vaginal and cesarean delivery, Acta Paediatr Hung, Vol. 16. No. 2. pp. 155-161. (1975) [14] G. Várallyay Jr., Infant cry analyzer system for hearing disorder detection, Periodica Politechnica, TU Timişoara, Transactions on Automatic Control and Computer Science, Vol. 49/63. pp. 57-60. (2004) [15] G. Várallyay Jr., Z. Benyó, A. Illényi, Z. Farkas, L. Kovács, Acoustic analysis of the infant cry: classical and new methods, Proc. 26th Conf. IEEE Engineering in Medicine and Biology, San Francisco, CA, pp. 313-316. (2004) [16] G. Várallyay Jr., Z. Benyó, A. Illényi, Z. Farkas, G. Katona, An Attempt to Detect Hearing Disorders by Acoustic Features of the Infant Cry, Proc. Forum Acusticum 2005, Budapest, in press [17] G. Várallyay Jr., Z. Benyó, A. Illényi, Z. Farkas, Methods for the Analysis of Acoustic Biomedical Signals. Proc. IASTED International Conference on Biomedical Engineering (BioMED 2005), Innsbruck, pp. 434-438. (2005)