taalunieversum

Direct naar menu
U bent hier: start » taal » technologie » taal in bedrijf »

Spraakherkenning bespaart politie veel tijd

Perfect is spraakherkenning nog steeds niet. Bij de Amsterdamse politie blijkt het gebruik ervan erg nuttig. De Vlaamse televisiezender VRT profileert zich zelfs als Europees koploper inzake het gebruik van spraakherkenning voor live ondertiteling van televisie-uitzendingen. 'Zelfs Talpa is komen kijken.'

"Spraakherkenning staat inderdaad nog niet helemaal op punt", vertelt Bernard Dewulf, eindverantwoordelijk voor de teletekstondertiteling van de VRT. Toch gebruikt de Vlaamse openbare omroep spraakherkenning voor ondertiteling sinds 2002. "Als eerste in Europa", voegt Dewulf eraan toe. Tot dan toe moest de televisiezender de ondertiteling handmatig invoeren. Dewulf: "De kunst, d� grote uitdaging, vooral bij live programma's, is om de tekst zo snel en accuraat mogelijk in te voeren. In Oostenrijk hebben ze de wereldkampioen sneltypen in dienst genomen. Maar daar is er natuurlijk maar ��n van!" Het allerprilste gebruik van spraakherkenning bij de VRT dateert alweer van 1998. De omroep heeft het experiment met Philips Free Speech om kwalitatieve redenen evenwel moeten stopzetten.

Het daaropvolgende experiment in 1999 met Velotype, het systeem dat de NOS in gebruik heeft, werd eveneens gestaakt. Dewulf: "Een opleiding kost twee jaar. De BBC gebruikt op dit moment nog stenografie, de derde methode. Maar ook zij zijn stilaan aan het omschakelen naar spraak."

Nog in hetzelfde jaar van het mislukte Velotype-experiment werd VoiceXpress van het toen roemrijke, eveneens Vlaamse Lernout & Hauspie Speech Products in gebruik genomen. Nadat genoemd bedrijf zijn Amerikaanse branchegenoot Dragon Systems had overgenomen, is de VRT Dragon NaturallySpeaking (DNS) gaan gebruiken. Dewulf: "In maart 2001 is DNS officieel in gebruik genomen voor live ondertiteling. In januari 2002 zijn we DNS gaan gebruiken voor alle live ondertitelingen."

Hersprekers

Op dit moment wordt circa 45 procent van alle uitzendingen door de VRT ondertiteld. Het streven is dat in de loop van volgend jaar circa de helft van alle programma's ondertiteld wordt. "Op termijn gaan we naar een volledige ondertiteling. Misschien dat we dit in 2010 realiseren", vertelt Dewulf. Veel keuze heeft de VRT niet. Als openbare omroep wordt zij door de politiek verplicht om een aantal maatschappelijke functies te vervullen. Ondertiteling van programma's ten behoeve van doven en slechthorenden is zo'n verplichting. De omroep moet die ondertiteling verzorgen met 15 fulltimers. "Dat is relatief weinig", meent Dewulf. Spraakherkenning die sprekeronafhankelijk werkt bestaat vooralsnog niet. Om die reden heeft de VRT zijn ondertitelaars moeten omscholen tot zogenaamde hersprekers. " Eigenlijk werken die mensen op de manier van simultaan tolken", legt Dewulf uit en met een knipoog: "We noemen ze onze Dragonders."

De ondertitelaars beluisteren de televisiefragmenten, spreken in DNS in wat ze gehoord hebben en leggen op die manier de ondertiteling vast. "Het is een groot misverstand dat we een Dragonmicrofoontje onder Martine Tanghe, ons bekendste nieuwsanker, hebben hangen", zegt Dewulf. Voor off screen commentaar volstaat ��n herspreker. Soms gebruikt de VRT ook twee hersprekers die elkaar aflossen. In een aantal gevallen wordt de herspreker aangevuld door een corrector die de ondertiteling waar nodig verbetert. Dan nog blijft het aantal struikelblokken groot. "Politici praten soms over voetbal en voetballers soms over politiek", zegt Dewulf. De woordenschat die mensen gebruiken is in principe grenzeloos. "Maar DNS heeft ernstige lacunes in de basiswoordenschat. Een aantal woorden zoals 'topoverleg', 'spreekverbod', 'luchtpijp', 'zandbank' of 'golfbreker' kent DNS niet. Ook maakt het programma soms foute analyses. Van 'bestaan dus nog' maakt het programma 'bestaande smog', enzovoort."

Besparingen

"Je moet heel geduldig zijn om spraakherkenning te gebruiken", meent Ben van Scheppingen van de Politie Amsterdam, dienst Sociale Jeugd en Zeden. Het uitschrijven van verhoren van jeugdige slachtoffers van zedenzaken is een wettelijke verplichting. Door gebruik te maken van spraakherkenning kan de politiedienst de transcriptietijd van de verhoren inkorten van 16 uur naar plusminus 6 uur voor elk uur verhoor. De kosten voor de opstelling liepen in de duizenden euro's. Maar de kostenbesparing op jaarbasis kan oplopen tot circa 24.000 euro. "Dat is niet zo belangrijk. Belangrijker is dat we op veel relaxter kunnen werken", zegt van Scheppingen. Ook Dewulf noemt de potenti�le besparingen en het gebruiksplezier als argumenten ten voordele van DNS. "Spraakherkenning is simpel, flexibel, goedkoop en leuk."

De verplichting om letterlijke transcripties van de verhoren te maken, betekent dat daadwerkelijk elke zucht en snik vastgelegd moet worden. Voor diegene die de transcriptie moet verzorgen, betekent dit eindeloos luisteren en terugspoelen van de opnames. Het systeem bij de politie is getraind op de stem van ��n persoon. In het begin veroorzaakte de proefopstelling veel problemen. Veel van die problemen konden worden verholpen door extra oefentijd in te lassen met oude verhoren. Van Scheppingen noemt spraakherkenning om die reden een never ending story: "Je moet steeds nieuwe woorden blijven toevoegen." Toch is de tevredenheid groot. "De trend bestaat om nu ook de verhoren met meerderjarige verdachten met spraakherkenning uit te werken."

© Luc Van Peteghem. Overgenomen uit Automatisering Gids d.d. 2 december 2005.

© Nederlandse Taalunie, 2000-2008 alle rechten voorbehouden
WegwijzerColofonContactVrijwaringOpmerkingen en reacties