| Fonetisch getranscribeerde spraakcorpora vormen waardevolle bronnen voor onderzoek naar uitspraakverschijnselen. Met kennis over de uitspraak van woorden kunnen automatische spraakherkenningssystemen verbeterd worden. Naar voorbereide spraak, zoals voorgelezen spraak, is al veel onderzoek verricht, maar over spontane spraak is nog onvoldoende bekend. Het Corpus Gesproken Nederlands (CGN), verzameld onder leiding van Nijmeegse taalkundigen, bevat grote hoeveelheden spontane spraak. Om dit corpus bruikbaar te maken voor onderzoek moet de spraak fonetisch getranscribeerd worden. Maar bijna 10 miljoen woorden met de hand transcriberen, dat is praktisch onmogelijk. Daarom is onderzocht hoe dat ook automatisch kan. Diana Binnenpoorte beschrijft in haar dissertatie hoe meerdere automatische procedures zijn ontwikkeld die leidden tot verbeterde transcripties en tot meer kennis over uitspraakverschijnselen in spontane spraak. Daarnaast zet ze uiteen hoe automatische transcripties kwalitatief vergeleken zijn met handmatige transcripties. Automatische transcripties van spontane spraak zijn nog niet goed genoeg, maar meer onderzoek naar uitspraakverschijnselen moet in de toekomst automatische transcripties op kunnen leveren die de kwaliteit van handmatige transcripties kunnen evenaren. |