KNAW

Research

Corpus Sign Language of the Netherlands (CNGT)

Pagina-navigatie:


Update Research data


Title Corpus Sign Language of the Netherlands (CNGT)
Period 05 / 2006 - 04 / 2008
Status Completed
URL http://www.let.ru.nl/sign-lang/
Research number OND1318726
Data Supplier RU-faculteit letteren

Abstract

The aim of this project is to collect and publish an innovative corpus of Sign Language of the Netherlands (Nederlandse Gebarentaal (NGT) that will be a core data source for any research effort aimed at analysing that language or sign language in general. It is now feasible for the first time to collect complex video data that can be stored digitally and accessed through internet, enriched with linguistic annotations. The use of modern metadata and annotation tools facilitates access to data independent of the location of the researcher, so that data can be centrally hosted and archived. Moreover, users can easily add annotations for specific research questions to existing material. Because of the insufficient quality and quantity of existing recordings, both elicited and spontaneous data from the two main variants of NGT (northern and western) will be recorded in this project, including both an older and a younger generation of adult signers from each region. These data will receive a basic annotation. All data will receive a sentence-level translation in both Dutch and English, the latter also ensuring access for the international research community. A corpus like this one will be essential for sign linguistic research, particularly on NGT, in the years to come. A subset of the data will be accessible to the general audience. Ensuring general access can be of substantial impact for the many hearing people acquiring NGT (parents of deaf children forming the prime example), given the limited and primarily child-oriented video materials that are currently available.

Abstract (NL)

In dit project wordt data uit de Nederlandse Gebarentaal (NGT) verzameld, gebundeld tot een innovatief corpus en gepubliceerd. Dit corpus zal een belangrijke bron van data vormen voor alle onderzoek m.b.t. de NGT en zelfs gebarentaal in het algemeen. Het is nu voor het eerst mogelijk om complexe videodata te verzamelen die digitaal opgeslagen kan worden en toegankelijk kan worden gemaakt via het internet. De data zullen verrijkt worden met metadata en linguistische annotaties. De hiervoor gebruikte programmatuur vergemakklijkt toegang tot de data, waar de onderzoeker zich ook bevindt. Hierdoor kunnen de data centraal gearchiveerd worden. Verder kunnen gebruikers van het corpus zelf gemakkelijk annotaties toevoegen aan het materiaal in het corpus voor hun eigen specifieke onderzoeksvragen. Er worden uitgelokte en spontane data verzameld uit de 2 belangrijkste varianten van de NGT (uit het noorden en westen van het land), omdat de hoeveelheid en kwaliteit van het bestaande materiaal onvoldoende is voor (vervolg-)onderzoek. Tevens wordt data verzameld bij zowel oudere als jongere gebaarders uit deze regio's. De data worden voorzien van een basisannotatie, een vertaling op zinsniveau in het Nederlands en het Engels, zodat de data ook toegankelijk zijn voor de internationale onderzoeksgemeenschap. Dit corpus zal essentieel zijn voor gebarentaalkundig onderzoek, specifiek over de NGT, in de komende jaren. Een deel van de data zal toegankelijk worden gemaakt voor het algemene publiek. Dit kan belangrijke gevolgen hebben voor de vele horende mensen die NGT leren (de belangrijkste groep waarvan wel bestaat uit de ouders van dove kinderen, omdat er momenteel slechts weinig videomateriaal beschikbaar is, welke voornamelijk gericht is op jonge kinderen.

Related organisations

Related people

Researcher J. Ros
Project leader Dr. O.A. Crasborn

Classification

A77000 Care of the disabled
D36000 Language and literature studies

Go to page top
Go back to contents
Go back to site navigation