Záróbeszámoló: Magyar spontán beszéd adatbázis 78315 sz. OTKA

Hasonló dokumentumok
a munkaerőpiac számos szegmensében egyaránt szükségszerű a használata (Szabó

A spontán beszéd kísérőjelenségei

A fonetik ar ol altal aban szeptember 15.

Óvodás és kisiskolás gyermekek interpretált beszédének vizsgálata

A HANGOK TANÁTÓL A BESZÉDTECHNOLÓGIÁIG. Gósy Mária. MTA Nyelvtudományi Intézet, Kempelen Farkas Beszédkutató Laboratórium

A beszédstílus meghatározó tényezői és temporális jellemzői

Beszédkutatás a technológiai fejlődés tükrében. Gráczi Tekla Etelka MTA Nyelvtudományi Intézet, Fonetikai osztály

Beszédkutatás Nyelvhasználat és alkalmazások. Programfüzet november

Lejegyzési útmutató a BEA Spontánbeszéd-adatbázis háromszintű annotálásához

TÁJNYELV, KÖZNYELV, BESZÉLŐK

A nyelvi változás beszédjelenségeinek vizsgálata

4. okt. 3.: statisztika: binomiális regresszió, saját kísérletek

VARJASI GERGELY. Beszédadatbázisok. 1. Mik azok a beszédadatbázisok?

Tartalom-visszamondások szerveződése felolvasás után

Képzési Program. Angol Nyelvi Képzési Program

IDEGEN NYELV ÉRETTSÉGI VIZSGA ÁLTALÁNOS KÖVETELMÉNYEI

Fonetikai Osztály Jelentés a 2013-as évről és terv

A spontán beszéd egyes jellemzői különböző felnőtt korcsoportokban

Beszédfeldolgozási zavarok és a tanulási nehézségek összefüggései. Gósy Mária MTA Nyelvtudományi Intézete

A nyelvtudomány műhelyéből

ANGLISZTIKA ALAPKÉPZÉSI SZAK ZÁRÓVIZSGA

Adatelemzés az R-ben április 25.

BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA

Készítette: Molnár Dávid. Beszédadatbázisok. A BUSZI és a nyelvjárási hangarchívumok

ELTE Angol Alkalmazott Nyelvészeti Tanszék

ÉRTÉKELÉSI ÚTMUTATÓ AZ EMELT SZINTŰ SZÓBELI VIZSGÁHOZ. Általános útmutató

HELYI TANTERV. Nyelvtan

Bevezetés a nyelvtudományba

BUDAPESTI MŰSZAKI és GAZDASÁGTUDOMÁNYI EGYETEM Természettudományi Kar KOGNITÍV TUDOMÁNYI TANSZÉK. SZERVEZETI és MŰKÖDÉSI SZABÁLYZATA

Szakmai és kommunikatív kompetencia a spontán beszédben

Reklám CL & LT Modell Mazsola Alkalmazás Példák Befejezés. Sass Bálint

A rehabilitációs team munka: a kommunikáció jellemzői és mintázatai a team megbeszélésen

BÁN ZSIGMOND RFEORMÁTUS ÁLTALÁMOS ISKOLA,

A társadalomtudományi kutatás teljes íve és alapstratégiái. áttekintés

A HUNGLISH PÁRHUZAMOS KORPUSZ

A Magyar Nemzeti Szövegtár új változatáról Váradi Tamás

Melléklet a pályázati adatlap 2. pontjához

6 + 2 kakukktojás perc variáció perc

A BESZÉDPRODUKCIÓ ÉS BESZÉDPERCEPCIÓ ÖSSZEFÜGGÉSEI: AZ ELHANGZÓ HÍREK FELDOLGOZÁSA

Fordítók megakadásjelenségeinek vizsgálata páros fordítási helyzetben Lesznyák Márta Bakti Mária

A magánhangzó-formánsok és a szubglottális rezonanciák összefüggése a spontán beszédben

A Békés Megyei Könyvtár Elektronikus Könyvtárának kialakítása

Program verzió:

Nyugat-magyarországi Egyetem Savaria Egyetemi Központ Berzsenyi Dániel Pedagógusképző Kar Filológiai és Interkulturális Kommunikáció Intézet

Zöld Út gazdasági nyelvvizsga

Korpuszok létrehozása. Korpuszok a nyelvészeti kutatásban szeptember 22.

Az ATON szakfolyóirat indítása

Lexikon és nyelvtechnológia Földesi András /

1 SZATHMÁRI ISTVÁN A MAGYAR NYELVTUDOMÁNY TÖRTÉNETÉBÕL

Magánhangzónyújtások a gyermeknyelvben

Beszédtechnológia az információs esélyegyenlőség szolgálatában

Szakdolgozati szeminárium

Kutatás és kommunikáció

5. Témakör TARTALOMJEGYZÉK

EURÓPAI BIZOTTSÁG III. MELLÉKLET ÚTMUTATÓ A PARTNERSÉGI MEGÁLLAPODÁSHOZ

Érettségi vizsgákról szóló tájékoztató (időpont, vizsgaleírás, segédeszközök)

Szakmai előrehaladási jelentések rendje

1 Nyelv, beszéd, írás

Nyugat-magyarországi Egyetem Savaria Egyetemi Központ Bölcsészettudományi Kar Filológiai és Interkulturális Kommunikáció Intézet

Tájékoztató az érettségiző tanulók számára a vizsgák időpontjairól, vizsgaleírásairól, a használható segédeszközökről

Alba Radar. 11. hullám

Az igekötők gépi annotálásának problémái Kalivoda Ágnes

ÉS S NYELVI REPREZENTÁCI CIÓ. MTA Nyelvtudományi Intézet

ALAPADATOK. KÉSZÍTETTE Balogh Gábor. A PROJEKT CÍME Hálózati alapismeretek

KAPITÁNY ZSUZSA MOLNÁR GYÖRGY VIRÁG ILDIKÓ HÁZTARTÁSOK A TUDÁS- ÉS MUNKAPIACON

Az újmédia alkalmazásának lehetőségei a tanulás-tanítás különböző színterein - osztálytermi interakciók

A Mazsola KORPUSZLEKÉRDEZŐ

A BESZÉDSZÜNETEK FONETIKAI SAJÁTOSSÁGAI A BESZÉDTÍPUS FÜGGVÉNYÉBEN. Bóna Judit

1, A találatok megjelenítése 2, Hol, hogyan találom meg? Milyen adatokra van szükség egy könyv megtalálásához? Avagy a példányinformációk értelmezése

PÉCS MEGYEI JOGÚ VÁROS ÖNKORMÁNYZATA KÖZGYŰLÉSÉNEK JÚNIUS 20-I ÜLÉSÉRE NÉPJÓLÉTI ÉS SPORT BIZOTTSÁG

Kódszám egyenlőségjellel: a megadott kurzus párhuzamos felvétele. * : Az alapozó képzés tárgyainak elvégzése után vehető fel a tárgy.

Vélemény kifejtése, érvelés és az interakció megvalósítása 3 Szókincs, kifejezésmód 3 Nyelvtan 3 Összesen 9 Harmadik feladat (Önálló témakifejtés)

A deixis megjelenési formái a prozódiában

Informatika szóbeli vizsga témakörök

Nagy Gábor compalg.inf.elte.hu/ nagy

Beszédhiba és beszédfeldolgozás

Doktori értekezés tézisei EÖTVÖS LORÁND TUDOMÁNYEGYETEM BÖLCSÉSZETTUDOMÁNYI KAR

Diskurzus a grammatikában Grammatika a diskurzusban

A tartalomelemzés szőkebb értelemben olyan szisztematikus kvalitatív eljárás, amely segítségével bármely szöveget értelmezni tudunk, és

Értékelési útmutató a középszintű szóbeli vizsgához. Angol nyelv

Országos Egészségfejlesztési Intézet

Eötvös Loránd Tudományegyetem. a "Közalkalmazottak jogállásáról szóló" évi XXXIII. törvény 20/A. alapján pályázatot hirdet

ÉRTÉKELÉSI ÚTMUTATÓ A KÖZÉPSZINTŰ SZÓBELI VIZSGÁHOZ. Általános útmutató

12. osztály nyelvtan anyaga: Nyelvi szinkrónia és diakrónia; a nyelv eredete és típusai

AZ ESÉLY AZ ÖNÁLLÓ ÉLETKEZDÉSRE CÍMŰ, TÁMOP / AZONOSÍTÓSZÁMÚ PÁLYÁZAT. Szakmai Nap II február 5.

Digitális kultúra, avagy hová lett az informatika az új NAT-ban? Farkas Csaba

Célnyelvi mérés a 6., 8. és a 10. évfolyamon Tartalmi keret

TÁRKI ADATFELVÉTELI ÉS ADATBANK OSZTÁLYA OMNIBUSZ 2002/10. SPSS állomány neve: Budapest, október

alap közép felső angol német francia orosz

PRO PUBLICO BONO PROJEKT MEGVALÓSÍTÁSI TAPASZTALATAI

Az empirikus vizsgálatok alapfogalmai

10. Morfológia és statisztikai grammatika Morfémák és variációszámok

Idegen nyelvi mérés eredményei

- A megyei igazgató pénzügyi-gazdasági jellegű döntéseinek szakmai előkészítése, támogatása;

Óvodás szülők tájékoztatása a TÁMOP Kompetencia alapú oktatás, egyenlő hozzáférés innovatív intézményekben.

Alba Radar. 22. hullám. Nyaralási tervek

Kiegészítő témakörök: Táblázatkezelés történeti áttekintés

SYLLABUS. Partiumi Keresztény Egyetem, Nagyvárad Bölcsészettudományi Kar magyar nyelv és irodalom

Fájlrendszerek. A Windows operációs rendszerek fájlrendszere

Szakképesítés, szakképesítés-elágazás, rész-szakképesítés, szakképesítés-ráépülés azonosító száma, megnevezése:

Átírás:

Záróbeszámoló: Magyar spontán beszéd adatbázis 78315 sz. OTKA A pályázat terve A kutatás célja egyfelől egy spontán beszéd adatbázis létrehozása volt (különféle típusú beszédanyagokkal), másfelől pedig kutatások végzése az adatbázis felhasználásával. A kutatás három évére terveztük összesen kilencven adatközlő beszédanyagának rögzítését, digitalizálását, a hanganyagok hangzáshű átírását, számítógépes rögzítését, archiválását; valamint különféle aspektusú fonetikai kutatások végzését és tanulmányok publikálását az eredményekről. A feladatainkat teljesítettük, a vállalt célokat megvalósítottuk. A számítógépes technológia segítségével létrehozható nagyméretű beszédadatbázisokat a fonetika harmadik forradalmának is nevezik a hangszínképelemzés és a számítógépes beszédelemző programok után. Számos, különféle méretű és típusú beszédadatbázist hoztak létre a világ nyelvein; a korábbi magyar nyelvi anyagot tartalmazó korpuszok, gyűjtemények, főként olvasott beszédet tartalmaztak. A jelen kutatásban tervezett beszélt nyelvi adatbázis a fonetikai és a tágabb értelemben vett nyelvészeti elemzésekre is alkalmas beszédanyag kialakítását tűzte ki célul. Eredmények Az adatbázis fejlesztését többrétű tervezés, a megfelelő szakirodalom, a más nyelvű adatbázisok tanulmányozása előzte meg. Kidolgoztuk a beszédrögzítés technikai körülményeit. Megterveztük az adatközlőkkel kapcsolatos munkálatokat, az azonosíthatatlanságukat biztosító folyamatokat (etikai vonatkozások). Meghatároztuk az adatbázis beszédtípusait, a témáit, a vonatkozó nyelvi anyagot, valamint a protokoll módszertanát. Megállapítottuk a lejegyzések kritériumrendszerét és az átírási szabályokat. Megvalósítottuk az archiválást. Számos kutatást végeztünk az adatbázis felhasználásával. 1. Beszédfelvételek. A terveknek megfelelően megtörtént a beszédadatbázis állandó felvételi körülményeinek kialakítása. A helyszín minden esetben az MTA Nyelvtudományi Intézet Fonetikai Osztályának csendesített stúdiószobája volt, valamennyi adatközlő felvételét itt valósítottuk meg. Biztosítottuk a hangrögzítéshez a korszerű technikai hátteret (AT 4040 kondenzátor stúdió mikrofon, Goldwave hangfelvevő program használata, 44 khz/16 bit mintavételezéssel). A technikai körülmények megfeleltek a nemzetközi elvárásoknak, illetve sok hasonló adatbázis felvételi körülményeit felülmúlták a tekintetben, hogy a helyiség és a technikai körülmények állandóak voltak. Megterveztük a lehetséges adatközlők felkutatását és részvételük megszervezését a felvételekhez. Ez azt is jelentette, hogy az interjúkészítőn kívül a társalgásban részt vevő harmadik személy jelenlétét is biztosítottuk. A kilencven felvétel mintegy 90%-ában ugyanaz a személy volt az interjúkészítő (ez lehetőséget nyújt különféle specifikus nyelvi, fonetikai elemzésekre is). A terveknek megfelelően elkészült a kilencven hangfelvétel. Megtörtént a beszélőkre vonatkozó adatok anonimizálása (a Nyelvtudományi Intézet etikai szabályzatának betartásával), aminek következtében az adatközlő kiléte és a rögzített hanganyag nem azonosítható. Az egyes hangfájlok kódolása tartalmazza a hanganyag sorszámát, valamint a beszélő nemére utaló rövidítést, illetve az ennek megfelelő sorszámot. Például: bea006f002 vagy bea052n037 (amelyek feloldása: az adatbázis hatos számú adatközlője, a második férfi beszélő, illetve az adatbázis ötvenkettedik adatközlője, a harminchetedik női beszélő).

Megvalósítottuk a rögzített hanganyagok többszörös archiválását (különböző adathordozókra: PC HDD, külső HDD, CD-ROM, DVD-ROM, pendrive). Megterveztük és elvégeztük a hanganyagok lekérdezhetőségét protokollegységek (lásd 4. pont) szerint. Ez azt jelenti, hogy minden adatközlő esetében a lekérdezhetőség biztosításával külön-külön rögzítettük a teljes felvétel egyes részeit (beszélőnként hat rész). Ezek külön-külön fájlként mentve is archiválva lettek. Ez arra ad lehetőséget, hogy a kutató mindig az általa kiválasztott (tematikus) beszédanyagokat kaphassa meg. A teljes beszédanyag időtartama: 89 óra 9 perc 59 másodperc. A legrövidebb felvétel 26 perc, 10 másodperc, míg a leghosszabb 1 óra, 30 perc, 41 másodperc hosszúságú. 2. Adatközlők. A 90 adatközlő közül 50 nő, 40 férfi, életkoruk 20 és 80 év közötti (1. ábra). A legfiatalabb beszélő 20, a legidősebb 73 éves volt a felvételkor. Szociológiai szempontok érvényesítése nem volt célja a kutatásnak, ezért csupán megemlítjük, hogy a 90 adatközlő közül kettő általános iskolai végzettséggel, 39 érettségivel és 49 valamilyen felsőfokú végzettséggel rendelkezik. Az életkoron túl további adatokat is rögzítettünk az adatközlők válaszai alapján, amelyek a beszédprodukcióval kapcsolatba hozhatók, így a későbbi kutatások szempontjából releváns információkat jelenthetnek. Rögzítettük a beszélők magasságát, súlyát, valamint az, hogy dohányoznak-e (és ha igen, mióta). A 2. ábra az adatközlők termetének és súlyának a megoszlását mutatja. Kilencen évtizedek óta dohányoznak, tizenegyen csak néhány éve és hetvenen egyáltalán nem dohányoznak. Az adatközlőkre, illetve a beszédanyaguk felvételére vonatkozó adatokat Excel-fájlokban összesítettük, ez a későbbi kutatási felhasználást nagymértékben megkönnyítette, az adatbázist áttekinthetővé tette. Az Excel-táblák a következő adatokat tartalmazzák: a beszélő kódját (amely tartalmazza a nemét), de külön oszlopban is feltüntettük, hogy női vagy férfi beszélő-e, az adatközlő életkorát, magasságát, súlyát, dohányzási szokását, valamint a spontán beszéd felvételeinek témáit (lásd 3. pont). 1. ábra Az adatbázisban rögzített 90 beszélő életkora

Személyek száma Személyek száma 25 20 20 15 15 10 10 5 5 0 150 155 160 165 170 175 180 185 190 195 0 50 60 70 80 90 100 110 120 130 140 Személyek magassága (cm) Személyek súlya (kg) 2. ábra Az adatbázisban rögzített 90 beszélő magassága és súlya 3. A spontán beszéd témakörei. Összeállítottuk azokat a témaköröket (életkori bontásban is), amelyek felhasználhatók a spontán beszéd rögzítésekor. Olyan témákat kellett választanunk, amelyek különösebb ismereteket nem igényelnek az adatközlőtől, alkalmasak hosszabb kifejtésre vagy megbeszélésre, és lehetőség szerint igazodnak az adatközlő életkorához (esetenként ahhoz is, hogy női vagy férfi beszélő). Meg kellett határozni azokat a témaköröket, amelyek elsődlegesen a véleménykifejtés, illetve azokat, amelyek főként a társalgás témájaként megfelelőek. Néhány példa a témák közül a véleménykifejtéshez: jogosítvány megszerzése, házassági szerződés, klímaváltozás, tanárok elleni erőszak, budapesti közlekedés, otthonszülés, internetes és hagyományos könyvtár, állatvédelmi törvény, mobiltelefon kisgyerekeknek; illetve a társalgáshoz: álláskeresés, dohányzás, házasság vagy együttélés, színházi élet, gázkrízis Európában, válság hatása a kultúrára, metróépítés, diákok jogai, nők és karrier, gyermekvállalás, kerékpározás mint közlekedési forma. 4. A felvételi protokoll. Az adatbázis felvételeinek protokollja 6 részből áll. Ezek a következő címkékkel jellemezhetők: narratíva, véleménykifejtés, tartalomösszegzés, mondatismétlés, társalgás, felolvasás. a) A narratívák az adatközlő életéről, családjáról, munkájáról, hobbijáról szólnak, többékevésbé összefüggő monologikus szövegek. Cél, hogy az adatközlő minél hosszabban beszéljen anélkül, hogy az interjúkészítőnek meg kelljen szólalnia. Az interjúkészítő csak akkor kérdez, ha a beszélő jelzi, hogy befejezte. b) A véleménykifejtés egy az interjúkészítő által megadott téma véleményezése (a példákat lásd a 3. pontban). Ez a spontán beszéd is tartalmaz narratívaszerű részeket, de jellemzők a dialógusok, továbbá a nézetkülönbségek vagy a nézetazonosságok verbális megjelenései. c) A tartalomösszegzés voltaképpen irányított spontán beszéd. Előkísérletek sorozatában választottuk ki azt a két szöveget, amelyek alkalmasnak bizonyultak ennek a verbális feladatnak a teljesítésére. Az egyik szöveg egy tudománynépszerűsítő cikk (174 szóból áll), a másik egy történelmi anekdota (270 szóból áll). Rögzítésük átlagos női beszélővel történt, a felolvasás instrukciója az volt, hogy értő-értető olvasás legyen (nem előadói teljesítmény). Az adatközlőnek meghallgatja az adott szöveget, majd ezt követően a saját szavaival összegzi a történetet (monológ formájában). d) A mondatismétlés anyaga 25 egyszerű és összetett mondat (pl. A farsangi bálban mindenkinek szép jelmeze volt. vagy Nem kötött biztosítást, ezért kisebb vagyonba került a kórházi ellátás.). Az előkísérletek eredményei alapján alakult ki, hogy melyek azok a mondatok, amelyeknek a tartalma és a morfológiai, szintaktikai szerkesztettsége alkalmas az

egyszeri meghallgatás utáni visszamondásra. A mondatokat az interjúvezető olvassa fel az adatközlőnek (átlagos tempóban és hangerővel), akinek egyszeri meghallgatás után azonnal meg kell azt ismételnie. e) A társalgás három személy beszélgetése, egyikük az adatközlő, a másikuk az interjúkészítő, a harmadik személy pedig a Fonetikai Osztály fiatal kutatóinak egyike. A témák változók (lásd a 3. pontban). A társalgásokban mindhárom beszélő azonos kommunikációs eséllyel vesz részt, ami egy kvázi-természetes helyzetet eredményez. f) Kétféle felolvasás szerepel a protokollban a későbbi összevethetőség érdekében. Az egyik felolvasáskor az adatközlőnek a 25, korábban elismételt mondatot kell meghangosítania, majd pedig a már hallott tudománynépszerűsítő cikket felolvasnia. 5. A beszédanyag átiratai. A hanganyagok átírása nagy jelentőségű a beszédadatbázisokban. A terveknek megfelelően kialakítottuk az elsődleges átírás kritériumait, megterveztük a lejegyzési útmutatót, megtörténtek a próbaátiratok. Ezek tapasztalatai alapján korrigáltuk a kritériumrendszert, és módosítottuk az útmutatót. Ez az elsődleges átírás helyesírás alapú, központozás nélkül, amely számos, a további kutatások számára hasznos hangzási tükröztetést tartalmaz. Az elsődleges átírás során a lejegyzők a Microsoft Office Word programot használták (.doc formátum). A lejegyzési útmutató szabályozza a köznyelvben használatos, de nem szótári alakban előforduló szavak, az idegen szavak, a rövidítések, a betűszók és mozaikszók, illetőleg a lejegyző számára értelmezhetetlen szóalakok lejegyzésének módját. Az átiratok készítése és ellenőrzésük folyamatosan zajlott. A beszédanyag hangzáshű leírása idő- és energiaigényes feladat (még jó felvételi körülmények között rögzített beszéd esetén is). Egyetlen percnyi beszéd átírása 15 20 percet vesz igénybe az időadatok mérése és a másodlagos (külső) ellenőrzés nélkül. A leírás időtartama függ az adatközlő és a többi beszélő kiejtésétől, a megakadásjelenségek és egyéb nonverbális jelzések mennyiségétől és típusaiktól (ezek lejegyzése tipográfiailag van kódolva a szövegekben), az egyszerre beszélések arányától stb. További, felhasználóspecifikus átírásokat is alkalmaztunk, amelyek mind a fonetikai, mind a beszédtechnológiai alkalmazásokban hasznosak. Kialakítottunk egy a Praat (ingyenesen használható) szoftver fájlformájában (TextGrid) archivált, többszintű annotációt a saját kutatásokhoz, valamint egy szakaszszintű annotálást a Transcriber (ingyenesen használható) program felhasználásával. Az átírásnak ez a két formája lehetővé teszi, hogy a beszédszövegek mellett a hangzás akusztikai lenyomata egyidejűleg megjeleníthető legyen. Mindkettő felhasználóbarát grafikus felülettel rendelkezik, és többféle platformon (Windows, Unix, Mac) alkalmazható. Az átiratok ellenőrzése nagymértékben csökkenti az elsődleges lejegyző relatív szubjektivitását. 6. A természetesség kérdése. A spontán beszédet tartalmazó adatbázisok esetében gyakorta felmerül a természetesség kérdése, vagyis az, hogy a beszélő mennyire viselkedik a közléseit tekintve természetesen egy ilyen nem szokásos beszédhelyzetben (ún. megfigyelői paradoxon problémája). A megfigyelői paradoxon áthidalásának egyik lehetséges módja az, ha az adatközlőtől többféle típusú beszédet rögzítünk. Ez a kritérium a jelen adatbázis esetében teljesült. Növeli a helyzet természetességét, ha olyan körülményeket tudunk teremteni, amelyben a beszélő szorongása oldódik, és a mikrofon okozta fokozott önellenőrzés megszűnik. Némely esetben az adatközlőink egy része a felvétel előtt bevallotta, hogy izgul, azonban szinte kivétel nélkül hamar feloldódtak. Ennek nyelvi igazolása az (is), hogy néha olyan szavakat és nyelvi fordulatokat használtak, amelyek nem illettek egy formális verbális kommunikáció kereteibe. Adatközlőink a körülményekhez képest természetes módon beszéltek.

7. Kutatások az adatbázison. Az elmúlt három év alatt különféle kutatásokat végeztünk a rögzített beszédanyagok felhasználásával. A zárójelentés megírásáig a pályázatban résztvevők összesen 31 tanulmányt publikáltak, 24-öt magyar és 7-et angol nyelven (utóbbiak közül öt ERIH A, B kategóriás folyóiratban jelent meg). További öt tanulmányunkat fogadták el publikálásra, közülük egy angol nyelvű, ezek megjelenése a 2012-es évben várható. Újabb kutatásainkat, amelyeket az adatbázis felhasználásával végzünk, egy önálló kötetben szándékozunk megjelentetni, várhatóan ebben a naptári évben. Szóbeli előadásra fogadták el a Clinical Linguistics and Phonetics nemzetközi kongresszusra (Cork, 2012) a spontán beszéd hezitálási jelenségei alapján benyújtott előadásunkat. A kutatott témák nagy vonalakban az alábbiak voltak: a magyar magánhangzók megvalósulásainak akusztikai-fonetikai vizsgálata, a zöngésségi hasonulás nyelvfüggő fonológiai szabályának érvényesülése olvasott és spontán beszéd összevetésével, a beszédalkalmazkodás kutatása a részt vevő partnerek ismeretségének és a feltételezett összeszokásnak a függvényében, egyetlen szó előfordulásainak akusztikai-fonetikai sajátosságai a spontán beszédben, a bizonytalanságot jelző és a hiba típusú megakadásjelenségek vizsgálata, a spontán beszédben előforduló magánhangzók időtartamai, a zöngétlen résmássalhangzók akusztikai szerkezete, a temporális variabilitás, a beszédhangok, hangkapcsolatok és szavak gyakorisági mutatóinak vizsgálata narratívákban, a lexikális hozzáférés sajátosságai, töltelékszók funkcionális vizsgálata. A jelen adatbázis a nyelvészet számos területén kínál tanulmányozásra alkalmas anyagot; lehetőség nyílik a lexikális hozzáférés folyamatainak elemzésére, a feltételezett szinkrón nyelvi változások igazolására, a szintaxis, a szemantika, illetve a prozódia összefüggéseinek, a nyelvi normativitás kérdéseinek az elemzésére (stb.). A beszédadatbázis jól felhasználható beszédtechnológiai kutatásokban. A tipikus beszélők anyagai támpontul szolgálhatnak az atipikus beszéd tanulmányozásához is. A pályázat két résztvevője (Horváth Viktória és Gyarmathy Dorottya) sikeresen megvédte PhD értekezését, amelyek anyagául az adatbázis szolgált. A pályázat egy további résztvevője (Gráczi Tekla Etelka) benyújtotta PhD értekezését, amelynek egy fejezetében az elemzések az adatbázis anyagán történtek. 8. Az adatbázis hozzáférhetősége. A fentiek tükrében fontosnak tartottuk, hogy az adatbázis csaknem a kezdetektől hozzáférhető legyen a megfelelő etikai szabályok szigorú betartásával és betartatásával. Eddig mintegy 30 tanulmányt írtak a projektben nem részt vevő külső kutatók és doktoranduszok az adatbázis anyagainak felhasználásával. Minden ilyen publikált tanulmány módszertani része tartalmazza az utalást az adatbázisra. Kitekintés A magyar spontán beszéd adatbázis közvetlen tudományos értékén és hasznán kívül számos gyakorlati alkalmazáshoz is közvetve vagy közvetlenül nélkülözhetetlen. Úgy ítéljük meg, hogy társadalmi szempontból is meghatározó jelentőségű, nemzetközi tekintetben is a legértékesebbek egyike. Az adatbázis beszédanyagának fontos hozadéka, hogy az ezredforduló (fővárosi) magyar beszédének rögzítésével kulturálisan is maradandó értéket képvisel.