Language Magazine: actualiteit en trends voor
taalwerkers
Taalschatkist moet straks ook corpus geschreven Nederlands bevatten
(LM van 20 juli 2005)
Vijfhonderd miljoen woorden. Zo veel woorden moet uiteindelijk het Corpus Geschreven Nederlands bevatten dat taalwetenschappers van de Radboud Universiteit in Nijmegen gaan verzamelen. Ze gaan dat samen met andere onderzoeksinstituten in Nederland en Vlaanderen doen. "Het verzamelen van zowel gesproken als geschreven Nederlandse taal is belangrijk om te voorkomen dat de taal in de elektronische omgeving uitsterft," aldus projectleidster dr. Nelleke Oostdijk van het Centre for Language Studies aan de Radboud Universiteit Nijmegen.
In eerste instantie gaan ze in een pilot-corpus 50 miljoen (geschreven) woorden verzamelen en protocollen, procedures en tools ontwikkelen voor spraak- en taaltechnologische toepassingen en taalkundig onderzoek.
Meer >>
Reageer U kunt uw reactie aan dit artikel toevoegen.
|
|
|
|
|