KNAW

Research

Phonetic Transcriptions of Large Speech Corpora

Pagina-navigatie:


Update content


Title Phonetic Transcriptions of Large Speech Corpora
Period 03 / 2004 - 04 / 2006
Status Completed
Dissertation Yes
Research number OND1300435

Abstract (NL)

Fonetisch getranscribeerde spraakcorpora vormen waardevolle bronnen voor onderzoek naar uitspraakverschijnselen. Met kennis over de uitspraak van woorden kunnen automatische spraakherkenningssystemen verbeterd worden. Naar voorbereide spraak, zoals voorgelezen spraak, is al veel onderzoek verricht, maar over spontane spraak is nog onvoldoende bekend. Het Corpus Gesproken Nederlands (CGN), verzameld onder leiding van Nijmeegse taalkundigen, bevat grote hoeveelheden spontane spraak. Om dit corpus bruikbaar te maken voor onderzoek moet de spraak fonetisch getranscribeerd worden. Maar bijna 10 miljoen woorden met de hand transcriberen, dat is praktisch onmogelijk. Daarom is onderzocht hoe dat ook automatisch kan. Diana Binnenpoorte beschrijft in haar dissertatie hoe meerdere automatische procedures zijn ontwikkeld die leidden tot verbeterde transcripties en tot meer kennis over uitspraakverschijnselen in spontane spraak. Daarnaast zet ze uiteen hoe automatische transcripties kwalitatief vergeleken zijn met handmatige transcripties. Automatische transcripties van spontane spraak zijn nog niet goed genoeg, maar meer onderzoek naar uitspraakverschijnselen moet in de toekomst automatische transcripties op kunnen leveren die de kwaliteit van handmatige transcripties kunnen evenaren.

Related organisations

Related people

Supervisor Prof.dr. L.W.J. Boves
Co-supervisor Dr. C. Cucchiarini
Doctoral/PhD student Dr. D.M. Binnenpoorte

Classification

D36000 Language and literature studies

Go to page top
Go back to contents
Go back to site navigation