Subsidie voor digitalisering Statenvertaling
De Utrechtse taalkundige Nicoline van der Sijs krijgt vijfduizend euro subsidie van de Nederlandse Taalunie voor haar project om de Statenvertaling uit 1637 met behulp van vrijwilligers te digitaliseren.
Dat heeft de Taalunie gistermiddag besloten. Het geld zal worden besteed aan de organisatie van dit project, waar zich binnen een paar dagen tijd ruim 250 vrijwilligers voor hebben aangemeld. De Statenvertaling uit 1637 wordt algemeen beschouwd als een van de sleutelteksten uit de Nederlandse cultuurgeschiedenis. In 2006 kreeg de Digitale Bibliotheek voor de Nederlandse Letteren (DBNL) een extra subsidie van 800.000 euro om duizend ‘sleutelteksten’ digitaal toegankelijk te maken. Men vond het toen te moeilijk en daardoor te duur om ook de Statenvertaling te doen. Overigens laat de DBNL alle boeken uittikken in de Filipijnen.
Tot zover het nieuwsgedeelte. Een lezer van deze rubriek vroeg waarom de Statenvertaling niet met behulp van een OCR-programma wordt gelezen. Antwoord: Optical Character Recognition (optische tekenherkenning) werkt uitstekend voor relatief moderne teksten, zeg: zetsel van ongeveer na 1850 of 1880. Voor oudere teksten moet je die programma’s trainen om bepaalde letters te herkennen maar dan nog stijgt het foutpercentage enorm. Voor modern zetsel garanderen programma’s als Finereader 8.0 (dat door veel wetenschappelijke instellingen wordt gebruikt) dat ruim 99 procent van de tekst foutloos door de software wordt herkend. Voor ouder zetsel worden geen percentages gegeven, maar dan stijgt het foutpercentage dramatisch. Kort gezegd: het kost meer tijd om de OCR bij dit soort teksten letter voor letter te controleren, dan om de brontekst in één keer uit te tikken - zeker als dit tikwerk door veel verschillende mensen wordt verricht.
Overigens: bij dit specifieke project - het uittikken van onder meer de Statenvertaling - zijn ook twee correctoren betrokken, om te voorkomen dat er tikfouten blijven staan, want dat is natuurlijk het risico als teksten met de hand worden uitgetikt.
Ewoud Sanders






donderdag 28 juni 2007, 19:26 uur
Ik vindt het goed dat de Statenvertaling nu ook digitaal beschikbaar wordt en ben er overtuigt van dat het werk ook door vrijwilligers kan worden gedaan.
Wat ik me alleen afvraag is of het niet goed zou zijn als ze wel een vergoeding voor hun werk zouden kunnen krijgen als ze dat dan toch willen.
Mattheus 20 is hier denk ik ook van belang.