Taal in Bedrijf 2008

Dit is een archiefpagina. Het kan zijn dat verwijzingen niet werken.

Op woensdag 19 november 2008 vond de tweede editie van het evenement Taal in Bedrijf plaats, dit keer in hotel Husa President Park in Brussel.

De focus van de ochtend lag op de actuele, succesvolle toepassingsmogelijkheden van taal- en spraaktechnologie in het bedrijfsleven en binnen de overheid. Na de middag kwam de toekomst van taal- en spraaktechnologie aan bod, met name wat een meer vraaggedreven onderzoeks- en stimuleringsprogramma best zou inhouden.

VRT Radio 1 kwam langs en maakte een korte reportage die de avond zelf nog op antenne ging.

Programma

09:30 - 10:00: registratie en koffie
10:00 - 10:15: verwelkoming en overzicht van de dag: Veerle Lories (Vlaamse overheid: departement Economie, Wetenschap en Innovatie)
10:15 - 11:10: acht parallelsessies
  10:20 - 10:30: inleiding sessievoorzitter
  10:30 - 10:50: demonstratie/presentatie 1
  10:50 - 11:10: demonstratie/presentatie 2
11:10 - 11:30: pauze
11:30 - 12:00: vervolg parallelsessies
  11:30 - 11:50: demonstratie/presentatie 3
  11:50 - 12:00: discussie
12:00 - 14:00: lunch, netwerkcafé en optionele middagsessies
  12:30 - 13:30: TST-Centrale: de Centrale voor Nederlandstalige Taal- en Spraaktechnologie: Remco van Veenendaal en Laura van Eerten (TST-Centrale)
  12:30 - 13:30: Innovatief aanbesteden: Peter Thevissen en Christophe Veys (IWT Vlaanderen) en De overheid als launching customer: Hans Kruithof (SenterNovem)
14:00 - 14:10: Een nieuw gezamenlijk Vlaams-Nederlands TST-programma?
  moderator van de plenaire sessies: Frederik Durant (Prompt! Spraaktoepassingen)
14:10 - 15:10: ideeën van de overheden
  14:10 - 14:30: TST en Vlaanderen: een blik vooruit: Dirk Kenis (iForum bvba voor de Vlaamse overheid - departement Economie, Wetenschap en Innovatie)
  14:30 - 14:50: Ondernemen en innovatie met TST: een kijk in Nederland: Martijn Nuijten (SenterNovem)
  14:50 - 15:10: Nederlands zonder technologische drempels: Linde van den Bosch (Nederlandse Taalunie)
15:10 - 15:30: pauze
15:30 - 16:30: ideeën van het veld
  15:30 - 15:50: synthese ochtendsessies - Frederik Durant
  15:50 - 16:10: Inge de Mönnik (Nederlandse Organisatie voor Taal- en Spraaktechnologie)
  16:10 - 16:30: Peter Edel (ContactCentres.be - Speech Technology Workgroup)
16:30 - 16:50: ideeën van de aanwezigen
16:50 - 17:05: afsluiting
17:05 - 18:45: netwerkcafé met Belgische specialiteiten

Parallelsessies

1. Nieuwe (multi-)media, spelindustrie en vrijetijdsbesteding

sessievoorzitter: Herman Caeyers (VRT-medialab)

 

Nederlandse Ondertiteling (Neon) - Arjan van Hessen (Telecats)

Er is een sterk toenemende vraag naar het ondertitelen van Nederlands gesproken TV programma's. Gebruikersverenigingen zetten omroepen en regeringen onder druk om de hoeveelheid ondertitelde programma's te doen toenemen. De VRT ondertitelt momenteel 65% van zijn Nederlandstalige programma's, met de belofte om tot 95% te groeien tegen 2010. Ook de NPO (Nederlandse Publieke Omroepen) heeft zich verplicht om 95% van haar uitzendingen te ondertitelen uiterlijk in 2010. Deze enorme toename van programma's die moeten worden ondertiteld, vereist grote investeringen in nieuwe technologieën en bijkomend personeel. Een van de mogelijke technologieën die ter hulp kan komen, is spraakherkenning. Experimenten met het gebruik van spraakherkenning voor ondertiteling worden uitgevoerd sinds de jaren '90 van de vorige eeuw. Sindsdien is de technologie veel geëvolueerd en momenteel wordt zij al routinematig ingezet door verscheidene omroepen, in de vorm van "respeaking" (inspreken van de ondertitel door een getraind persoon). In dit project zal een meer geavanceerde en minder arbeidsintensieve toepassing van de spraakherkenning worden geïmplementeerd voor ondertiteling, vooral oplijning van bestaande teksten of scripts met gesproken audio. Dit moet leiden tot een demonstrator voor (semi)automatische ondertiteling in het Nederlands. Dit gebeurt m.b.v. een spraakherkenningssysteem, waardoor automatisch rechtstreekse transcriptie van de audiostroom (het resultaat van de spraakherkenning) altijd in de achtergrond aanwezig is als fallback. De hier beoogde demonstrator stelt content providers, die momenteel geregeld respeaking gebruiken, in staat de meer geavanceerde toepassing van spraakherkenning te evalueren. We beogen dus ondertiteling van Nederlandstalige programma's in het Nederlands met als doelgroep voornamelijk de slechthorende populatie.

klik hier voor de presentatie

Automatische nasynchronisatie van dialogen bij film- en videoproductie - Pieter Soens en Werner Verhelst (VUB - ETRO)

Tijdens de productie van het geluidsspoor voor film of video is het vaak noodzakelijk de dialogen die op de set werden opgenomen te vervangen door studio opnamen. Redenen kunnen zijn: de slechte geluidskwaliteit (door ruis van machines, voertuigen...) of het feit dat sommige acteurs door de chaos die op de set heerste minder goede acteerprestaties neerzetten. De rechttoe rechtaan vervanging van de ene opname door de andere leidt echter tot een visueel storend gebrek aan overeenkomst tussen de lipbewegingen die men in het beeld ziet en de spraakklanken die men hoort. Om dit gebrek aan synchronie op te vangen hebben we een systeem voor automatische nasynchronisatie ontworpen. Deze software maakt het mogelijk een studio opname te editeren, de tijdsverschillen te bepalen tussen de studio opname en de oorspronkelijke opname van op de set en tenslotte de studio opname door tijdsschaling synchroon te maken met de oorspronkelijke dialoog opname en dus onrechtstreeks ook met het beeld. De technische moeilijkheden die we hiervoor moesten oplossen hadden vooral te maken met het opvangen van occasionele grote akoestische verschillen tussen beide opnamen (veroorzaakt door adempauzes, articulatieverschillen, omgevingslawaai, ingevoegde of weggelaten woorden...).

klik hier voor de presentatie

My Word Coach: Taaltechnologie voor "brain trainers" - Liesbeth Vervloesem (Ubisoft), Walter Daelemans (UA - CNTS) en Antal van den Bosch (Universiteit Tilburg)

My Word Coach is een spel voor de Nintendo DS en Wii, uitgebracht door het Frans-Canadese bedrijf Ubisoft, waarmee je je woordenschat kan vergroten. Eerst wordt je beginniveau vastgesteld. Daarna krijg je in zes verschillende spelletjes te maken met nieuwe, onbekende woorden die je op verschillende manieren moet leren herkennen en gebruiken (zowel de spelling als de betekenis). Op die manier wordt de woordenschat spelenderwijs uitgebreid. Het idee en de basisopzet voor My Word Coach komen van de Canadese toegepast taalkundige Thomas Cobb en het spel bestaat al voor Engels, Frans en Nederlands, en andere talen zijn in voorbereiding. We geven een demonstratie van het spel en gaan daarna in op de taaltechnologie die werd gebruikt om de woordenschat van het Nederlands in te delen in verschillende niveaus van complexiteit. Om de frequentie van woordfamilies in een corpus van 600 miljoen woorden te bepalen was robuuste tagging, lemmatizering en morfologische analyse nodig. Daarvoor werden taaltechnologische instrumenten gebruikt ontwikkeld aan UvT en UA. We sluiten af met enkele ideeën voor andere toepassingen van taaltechnologie in "serious gaming".

klik hier voor de presentatie

2. (Overheids)communicatie op maat

sessievoorzitter: Dirk Caluwé (Vlaamse overheid - Departement Diensten voor het Algemeen Regeringsbeleid - Kanselarij - Taaladvies)

 

Klinkende Taal: schrijfhulp in MS Word - Oele Koornwinder (Gridline Intranet en Zoeken)

Klinkende Taal helpt ambtenaren om duidelijke brieven te schrijven. Deze handige Word-tool controleert teksten snel op moeilijk taalgebruik en biedt ook alternatieven aan. Hierdoor houdt de tekstschrijver meer tijd over voor het aanpassen van zijn formuleringen. Klinkende Taal is permanent beschikbaar, objectief en controleerbaar. Bovendien krijgt u training on the job! Onze software biedt dan ook een onmisbare aanvulling op andere tekstverbetermiddelen, zoals schrijftrainingen, spelling- en grammaticacontrole en persoonlijk schrijfadvies.

Klinkende Taal maakt gebruik van Nederlandse taaltechnologie, zoals morfologische en syntactische analysemethodes. Hierdoor kan de programmatuur automatisch jargonwoorden, lange zinnen en ingewikkelde constructies opsporen, zoals passief taalgebruik. Al deze problemen worden in de tekst gemarkeerd, zodat u direct ziet waar de tekst voor verbetering vatbaar is. Onze software kan ook worden ingezet om woorden en zinsconstructies op te sporen die volgens een wetenschappelijk vastgestelde norm leesproblemen zullen opleveren. Hierdoor is Klinkende Taal automatisch af te stemmen op de huisstijl van uw organisatie en het taalniveau van uw doelgroep.

Met duidelijke brieven bereikt u meer burgers en krijgt u minder vragen en klachten. Een investering in Klinkende Taal kan dan ook tijd en kosten besparen. En uiteindelijk is het de burger die hiervan profiteert.

klik hier voor de presentatie

TST voor financiële diensten bij de Rabobank - Ruud Smeulders (Rabobank)

Bij de huidige digitale financiële dienstverlening wordt steeds meer taal- en spraaktechnologie toegepast. Dit is een technologie trend die versterkt wordt door de behoefte vanuit de consument en de maatschappij. Middels een aantal voorbeelden vanuit de Rabobank zal dit worden toegelicht. Zo zal een geldautomaat met spraak en mobiele toepassingen van spraak en taal technologie getoond worden. Ook enkele toekomstige toepassingen komen aan de orde. Zo worden de resultaten getoond van een innovatieproject om een aangepaste user interface van een geldautomaat te ontwikkelen om deze in Nederland (en later wereldwijd) geschikt te maken voor laag geletterden of mensen die de schrijftaal in een land niet kennen. Verder komen de vorderingen van enkele andere innovatieprojecten ten behoeve van email visualisatie en kennisnetwerken aan de orde

klik hier voor de presentatie

ABOP, Automatische BijsluiterOPtimalisator - Véronique Hoste (Hogeschool Gent) en Claudia Peersman (Hogeschool Antwerpen)

Ondanks de wettelijke bepalingen betreffende de leesbaarheid van de bijsluiter voor het publiek en de concrete uitwerking van sjablonen met standaardformuleringen is de bijsluitertekst nog altijd niet echt 'gebruikers'vriendelijk, d.w.z. hij is moeilijk leesbaar en leidt bij de patiënt niet steeds tot het juiste gedrag. De leesbaarheid van de bijsluiter wordt bemoeilijkt door onnodige herhaling, te veel vakterminologie, en ten slotte is er ook vaak een onduidelijke scheiding tussen informatie, instructies en risicowaarschuwingen waarbij de link ontbreekt tussen de formulering en een gradatie van het dringende karakter van de instructie of de ernst van het risico. Het ABOP-project wil door verregaand gebruik te maken van taaltechnologische tools voor syntactische en semantische analyse een auteursomgeving (een software-prototype) ontwikkelen, die de auteur niet alleen leidt in de keuze van allerlei vormelijke aspecten, maar hem ook bijstaat op inhoudelijk vlak en voor de drie bovenvermelde knelpunten een oplossing biedt. De impact van elk van deze inhoudelijke ingrepen wordt gemeten aan de hand van een kwaliteitstest naar de leesbaarheid van de bijsluiter. In deze presentatie geven we een demo van de auteursomgeving. We demonstreren hoe vakterminologie werd opgespoord en vervangen door een populaire term of aangevuld met een definitie. Bovendien bespreken we de resultaten van de eerste pilootstudie, die zich toespitste op het begrijpen van passages in de bijsluiter die in het verleden voornamelijk op het gebied van terminologie problematisch bleken. In deze studie werd nagegaan of een bijsluiter al dan niet beter scoort op het gebied van leesbaarheid na toepassing van de tool.

klik hier voor de presentatie

3. E-overheid

sessievoorzitter: André de Vleeschouwer (Instituut voor BreedBandTechnologie)

 

Tekstanalysetechnologie voor regeringen en bedrijven - Andrés Dominguez-Burgos (Crossminder)

Crossminder is een bedrijf dat actief is op het vlak van taaltechnologieën en semantic engineering. Het bedrijf ontwikkelt software die op een intelligente manier informatie in verschillende talen analyseert (text analytics, crosslingual text mining). Onze software kan bovendien de betekenis van de teksten achterhalen. Met onze producten kan de gebruiker grote hoeveelheden gegevens zeer precies classificeren, ambiguïteit oplossen, informatie in anderen natuurlijke talen beschikbaar maken of deze zo weergeven dat andere softwareproducten ze kunnen begrijpen en verwerken. Onze technologie is gebaseerd op een optimale combinatie van uiteenlopende domeinen als linguïstiek, statistiek en semantiek. Organisaties die massaal websites en compilaties van documenten intelligent en snel moeten analyseren, hebben groot belang bij de technologie van Crossminder. Wij richten ons in hoofdzaak tot veiligheidsdiensten, internationale organisaties waar medewerkers informatie in verschillenden talen moeten opzoeken of classificeren en bedrijven in de communicatiesector.

klik hier voor de presentatie

Spraak helpt bij het inburgeringsproces - Staffan Meij (VoiceCorp) en Tibo Jansingh (KleurRijker)

KleurRijker is een lesmethode die de cursist optimaal voorbereidt op het inburgeringsexamen. De methode biedt training in de groep, op de computer en in de praktijk. De cursist leert Nederlands, leert over Nederland en oefent het inburgeringsexamen. Veel van de cursisten hebben moeite met geschreven Nederlands. Het aanbieden van spraak op het digitale deel van de cursussen is derhalve een hulpmiddel voor de cursisten om de lesstof tot zich te nemen. Hiernaast is de combinatie van juist schrift en spraak een input die leidt tot verbeterde uitspraak- en leesvaardigheden. Om dit mogelijk te maken heeft KleurRijker gekozen voor de ReadSpeaker toepassingen van VoiceCorp. VoiceCorp levert een reeks van spraaktoepassingen voor het internet. De ReadSpeaker toepassingen zijn volledig als webservice ingericht en kunnen derhalve zeer eenvoudig geïntegreerd worden in bestaande websites en/of platformen. De voorleesfunctionaliteit is zeer sterk te tunen naar de wensen van de eigenaar van de toepassing en KleurRijker heeft zelf de mogelijkheid om de uitspraak van specifieke woorden te beënvloeden.

klik hier voor de presentatie

Audio Mining - Sander de Graaf (DutchEar)

Met Audio Mining als hulpmiddel kunnen geluidsfragmenten op inhoud worden doorzocht. Met spraakherkenning wordt gesproken tekst in geluidsfragmenten uitgeschreven en door middel van een grafische user interface wordt de inhoud doorzoekbaar gemaakt. Experimenten wijzen uit dat Audio Mining zeer nuttig is, en veelbelovend is voor brede inzet bij organisaties. Hoewel de technologie nog niet breed wordt toegepast, wordt de toegevoegde waarde vooral verwacht in het doorzoekbaar maken van gesprekken in call centers, bij openbare vergaderingen en bij entertainment content (TV, radio). Deze presentatie gaat in op de ervaringen en visie van Dutchear bij Audio Mining.

klik hier voor de presentatie

4. E-gezondheid en levenslang onafhankelijk leven

sessievoorzitter: Inge de Mönnink (Dedicon)

 

Audiokrant en Woody, taaltechnologie ten dienste van personen met een leesbeperking- Frank Allemeersch (Sensotec)

Sensotec nv is een bedrijf actief in de nichemarkt van producten voor personen met een leesbeperking. Het Audiokrant project en het Woody project zijn twee STEVIN demonstratieprojecten met Sensotec als co&oumlrdinerend partner. De doelstelling van het Audiokrant project was de uitwerking en demonstratie van een specifieke dienstverlening aan personen met een leesbeperking, met name de dagelijkse uitgave van een gesproken versie van de dagbladen "De Standaard" en "Het Nieuwsblad". Voor het inspreken wordt gebruik gemaakt van text-to-speech technologie en als bestandsformaat wordt het Daisy-formaat gebruikt. De dagelijkse verspreiding gebeurt op CDROM. Dit project is afgewerkt en heeft geresulteerd in een dagelijkse service verzorgd door vzw Kamelego.

Het Woody project richt zich op dyslectici. Het resultaat van dit project zal een sprekende zelf corrigerende woordvoorspelling specifiek gericht op het gebruik door dyslectici zijn. Het gebruik van woordvoorspelling is voor heel wat dyslectici de aangewezen manier om spelfouten te voorkomen en op een snelle en efficiënte manier tekst te produceren. Spelfouten voorkomen is bij mensen met dyslexie/dysorthografie gemakkelijker te realiseren dan spelfouten corrigeren met behulp van spellingscontrole. Zij maken immers voornamelijk inconsequente fouten. Door de combinatie te maken van zelfcorrectie en woordvoorspelling, kan de focus op het begin van het woord geplaatst worden. Het volstaat om de zelfcorrigerende functie te beperken tot de beginletters van een woord om ondanks de foute schrijfwijze toch de correcte suggestie te blijven zien.

klik hier voor de presentatie

EST: op E-learning gebaseerde SpraakTherapie - Lilian Beijer (Sint Maartenskliniek Nijmegen)

Eén van de projecten binnen het OSTT betreft een op E-learning gebaseerde SpraakTherapie (EST). EST is ontwikkeld in een samenwerkingsverband van de Sint Maartenskliniek, de Faculteit der Letteren (afdeling Taalwetenschap) en het Universitair Centrum voor Informatievoorziening (UCI), alle te Nijmegen.

EST is in feite "tele-spraaktraining", waarvan de inhoud zich in eerste instantie richt op patiënten met dysartrische spraak als gevolg van een CVA of M.Parkinson. Als gevolg van de vergrijzing zal deze groep, die doorgaans fysiek minder belastbaar is, fors groeien in de nabije toekomst. EST richt zich op drie groepen gebruikers:

  1. Patiënten die zelfstandig hun spraak willen oefenen.
  2. Therapeuten (logopedisten)
  3. Onderzoekers (taal- en spraakpathologen, taal- en spraaktechnologen)

In de presentatie komen de mogelijkheid en het belang van een digitale databank van pathologische spraak door middel van EST aan de orde. Tevens wordt EST als platform voor verdere ontwikkeling van E-health op het terrein van communicatieve beperkingen besproken.

 

klik hier voor de presentatie

 

Taaltechnologie ter ondersteuning van rehabilitatie na cochleaire implantatie - Filiep Van Poucke (Advanced Bionics)

Bij vele vormen van doofheid is cochleaire implantatie een effectieve behandeling om het gehoor in grote mate te herstellen. Wereldwijd zijn meer dan 150 000 mensen gebaat bij deze hoorprothese. Ondanks de ruime acceptatie en de goede resultaten blijft elektrisch horen toch sterk verschillend van normaal horen. Daarom is na implantatie een intensieve rehabilitatie noodzakelijk om te wennen aan het nieuwe geluid. Deze zorg kan echter maar beperkt aangeboden worden door professionele spraaktherapeuten in gespecialiseerde centra.

Het HATCI project heeft tot doel om het rehabilitatie-aanbod uit te breiden door de ontwikkeling van een computerpakket dat additionele luisteroefeningen -en testen aanbiedt in de thuissituatie. Het pakket presenteert teksten, met of zonder lipbeeldondersteuning. Het is de bedoeling dat de patiënt de zinnen herhaalt. Hierbij wordt de rol van de spraaktherapeut overgenomen door automatische spraakherkenning. De computer scoort de zinnen en geeft de nodige feedback. De doelgroep zijn zowel volwassenen als kinderen. Voorwaarde is wel dat ze een goede uitspraak bereikt hebben.

De partners in het HATCI project zijn Advanced Bionics, een producent van cochleaire implantaten, de Leuvense universiteit, verantwoordelijk voor de spraakherkenning en ONICI, een VZW die informatie biedt rond alle aspecten van cochleaire implantatie. Het project wordt financieel ondersteund door het STEVIN programma.

klik hier voor de presentatie

5. E-(taal)leren en -testen

sessievoorzitter: Theo van den Heuvel (Polderland Language and Speech Technologies)

 

Spelspiek, een spellingshulpmiddel - Michiel Goosen (Van Dale Lexicografie)

Veel jongeren hebben problemen met spelling, maar ook mensen die beroepsmatig met taal omgaan hebben regelmatig vragen over de spelling van bepaalde woorden en zouden voordeel kunnen hebben bij een gemakkelijk toegankelijk hulpmiddel. Er bestaan al verschillende manieren om de spelling van woorden te controleren. Spelspiek voegt een dynamische eigenschap toe: je kunt Spelspiek gebruiken met moderne communicatie-interfaces zoals Web browsers, MSN of SMS. Bovendien is het mogelijk om spellingsvragen in natuurlijke taal te stellen. Spelspiek gebruikt lexicale gegevens als woordenlijsten en fonetiek die beschikbaar gesteld zijn door INL en Van Dale. De software Spelspiek is een combinatie van de software voor spellingscorrectie van Polderland met de chatbot software van Elitech.

klik hier voor de presentatie

Ontwikkeling van wetenschappelijk onderbouwde elektronische taaltoetsen op maat voor professionals - Kathleen Heireman (Business Language and Communication Centre)

Als spin-off van de K.U.Leuven en VOKA, geeft BLCC taalopleidingen op maat van het bedrijfsleven. Om het taalniveau van cursisten op een snelle en objectieve manier te testen via elektronische online taaltoetsen, zocht BLCC een gefundeerde, wetenschappelijk onderbouwde methodologie. De wetenschappelijke onderbouw is cruciaal omwille van de groeiende vraag naar normalisatie en internationale erkenning van taalniveaus. De didactische en technologische partners van BLCC, respectievelijk K.U.Leuven (ITEC en CTeO) en Televic Education realiseerden samen de vernieuwde Selor taaltesten. Voortbouwend op deze knowhow, moest worden onderzocht in welke mate de daar toegepaste methodologie "as such" kon worden ge&iumlmplementeerd bij BLCC. De testafnametijd zou immers drastisch korter zijn bij ons doelpubliek, en de testen moesten ook een profielspecifieke component bevatten, teneinde ook in de taaltoetsing de maatwerkfilosofie van BLCC te realiseren. Om dit te onderzoeken, loopt momenteel een haalbaarheidsstudie, gesubsidieerd door het IWT. Tijdens deze presentatie, stelt Kathleen Heireman u de verschillende fases van dit project kort voor met een sterke focus op de keuzes die werden gemaakt voor de ontwikkeling en metadatering van de taaltestvragen. U krijgt concrete taaltestvragen te zien alsook de online applicatie die BLCC gebruikt voor de testafname. Wij lichten toe waarom wij geloven in de toegevoegde waarde van het product die uit deze studie zal voortvloeien en stellen u ook al graag de uitbreidingspistes voor die we voor ogen hebben om ook spreekvaardigheid te testen.

klik hier voor de presentatie

Een luisterende computer voor het trainen van spreekvaardigheid: DISCO - Helmer Strik (RU Nijmegen - CLST)

Als je een andere taal goed wilt leren spreken is oefenen met schrijven niet voldoende, omdat goede schriftelijke taalvaardigheid niet automatisch leidt tot goede mondelinge taalvaardigheid. Verder is voor het oefenen van mondelinge taalvaardigheid in de klas meestal niet voldoende gelegenheid. Daarom zou het handig zijn als we computerprogramma's zouden kunnen gebruiken voor het trainen van spreekvaardigheid. Er bestaan al wel vele computerprogramma's om talen te leren, programma's waarbij de student kan lezen, luisteren, en reageren via toetsenbord of muis. Maar deze programma's geven geen feedback over aspecten van mondelinge taalvaardigheid. Om deze lacune te vullen wordt in het STEVIN-project DISCO ('Development and Integration of Speech technology into COurseware for language learning') gewerkt aan de ontwikkeling van een dergelijk programma dat studenten Nederlands als tweede taal (NT2) feedback geeft over hun uitspraak, woordvolgorde en woordvormen. Dit STEVIN-project duurt drie jaar en is een voortzetting van eerder onderzoek, het project Dutch-CAPT, waarin al gewerkt is aan een computerprogramma dat feedback geeft op de uitspraak van het Nederlands. Nieuw aan dit vervolgonderzoek is dat er nu technologie ontwikkeld wordt die ook fouten in de syntaxis (woordvolgorde) en de morfologie (woordvormen) corrigeert. Een zin als "Ik gaan naar huis" moet straks door de computer herkend worden als fout, en gecorrigeerd worden naar: "Ik ga naar huis"; en ook "ik naar huis gaan" moet gecorrigeerd worden als "Ik ga naar huis". Het programma moet in staat zijn om automatisch deze uitingen van taalleerders te herkennen, fouten op te sporen, en hierover geschikte feedback te geven. Dit maakt het mogelijk om spreekvaardigheid te oefenen met je PC in je eigen omgeving, net zo vaak en zo lang als je wilt.

klik hier voor de presentatie

6. Vertalen en vertaalhulp

sessievoorzitter: Rudy Tirry (Lionbridge Belgium)

 

Machinevertaling: ingrediënten voor een succesvolle implementatie - Nathalie De Sutter (Cross Language)

Lang werd gehoopt (en gevreesd) dat machinevertaling de tijdsrovende en dure "menselijke" vertaalactiviteit op een dag volledig zou vervangen. Groot was dan ook de ontgoocheling (en de opluchting) toen bij de lancering van nieuwe systemen de outputkwaliteit telkens weer onvoldoende bleek te zijn. Vandaag kijkt men echter met andere ogen naar de technologie. In een duidelijk afgelijnde context en met realistische verwachtingen slaagt machinevertaling erin waardevolle oplossingen te bieden. Met name bij text mining en gisting is het de gebruiker er minder om te doen perfecte vertaalkwaliteit te verkrijgen. Hij wil eerder een idee krijgen van de globale inhoud van een tekst om uit te maken of die al dan niet vertaald dient te worden. Op die manier kunnen overbodige vertalingen worden vermeden en kan meer geïnvesteerd worden in teksten die dat verdienen. Ook inde vertaalindustrie, waarin men streeft naar publiceerbare kwaliteit, wordt machinevertaling beschouwd als een nuttige vertaalhulp die de productiviteit van vertalers verhoogt en de consistentie verbetert. Rond dit gegeven bouwen bedrijven business cases die de return on investment aantonen. Cross Language laat zien hoe bedrijven efficiënt met machinevertaling aan de slag kunnen. Welke systemen zijn momenteel beschikbaar op de markt? Hoe definiëren we een realistisch verwachtingspatroon binnen de gegeven context? Waarom is een correcte evaluatie noodzakelijk om tot een succesvolle implementatie te komen?

klik hier voor de presentatie

Waarom investeren in vertaaltechnologie? - Jurgen Goens (Xplanation)

Vertaalgeheugens, machinevertaling, terminologie-extractie, terminologiedatabases, vertaalinterfaces, local approval tools, ... en het hele workflowproces daarrond, allemaal dragen ze bij tot efficiënt en kwaliteitsvol vertalen. Maar hoe kunt u hierin efficiënt investeren? De Tstream-technologie toont hoe bedrijven rechtstreeks toegang kunnen krijgen tot een brede waaier van vertaaltechnologieën. Hoe past die technologie in uw bedrijfsproces? Wat wordt uw rol in het vertaalproces? Wat geeft u uit handen?

klik hier voor de presentatie

Parse and Corpus based Machine Translation (PaCo-MT) - Vincent Vandeghiste (K.U.Leuven - CCL)

We presenteren het PaCo-MT prototype (Parse & Corpus-based Machine Translation), waarin een nieuwe benadering tot vertaaltechnologie onderzocht en geïmplementeerd wordt. In dit project bouwen we een MT systeem voor de taalparen NL-FR en NL-EN (in beide richtingen) aan de hand van reeds bestaande (en publiek beschikbare) parsers en corpora. We belichten de architectuur van het systeem en besteden hierbij aandacht aan de integratie van MT met vertaalgeheugens, evenals aan de menselijke post-editing component, en hoe de informatie die daaruit gehaald wordt ons systeem in staat stelt bij te leren. In het project is eveneens een uitgebreide evaluatie-component voorzien, waarbij evaluaties uitgevoerd worden door een vertaalbureau.

klik hier voor de presentatie

7. Automotive, mobiliteit en logistiek

sessievoorzitter: Jan Verhasselt (Tele Atlas)

 

Draagbare navigatieapparaten en spraaktechnologie: het faciliteren van een veiliger en plezieriger rijervaring - Michel Alders (TomTom)

Het praatje zal volgende punten behandelen:

  • hoe TomTom spraaktechnologie ontwerpt;
  • hoe spraaktechnologie bij kan dragen aan de veiligheid in de auto;
  • hoe eindgebruikers spraaktechnologie beoordelen;
  • hoe TomTom spraaktechnologie wil toepassen in de toekomst.

 

klik hier voor de presentatie

Doorbraak van spraaktechnologie in mobiele toepassingen: nieuwe uitdagingen - Bart D'hoore (Nuance Communications International)

Spraaktechnologie vindt men steeds vaker terug in mobiele toestellen en meer specifiek in de automobielwereld. De meeste autofabrikanten bijvoorbeeld bieden tegenwoordig modules aan voor de bediening van telefoon, radio en navigatiesystemen met de stem, soms als optioneel pakket, soms als standaarduitrusting. Ook draagbare navigatietoestellen krijgen een spraakinterface. De evolutie naar een massaproduct stelt nieuwe eisen van robuustheid en bruikbaarheid voor een breed publiek. In deze presentatie zullen we een aantal voorbeelden laten zien van dergelijke toepassingen en de uitdagingen die hiermee gepaard gaan illustreren. Ook zullen we ingaan op het belang van onderzoek in het Nederlandse taalgebied en de aspecten die in het kader van Stevinprojecten bekeken worden.

klik hier voor de presentatie

Verwerking van documentstromen door tekstherkenning - Jakub Zavrel (Textkernel)

Organisaties met grote volumes inkomende communicatie in de vorm van papier, e-mail of digitale documenten zien zich steeds vaker geconfronteerd met een formidabele data-entry klus om de informatie in deze stroom beschikbaar te maken in hun interne IT systemen. In deze presentatie laat ik een aantal toepassingen de revue passeren (adresherkenner, factuur- en orderherkenner) die Textkernel heeft gebouwd voor TNT Post om de verwerking van ongestructureerd post- en fax-stromen te faciliteren. Het doel is aan te tonen dat de inzet van 'free-format' herkenning gebaseerd op een combinatie van taaltechnologie en machine learning een concurrentievoordeel biedt.

klik hier voor de presentatie

8. Business Intelligence

sessievoorzitter: Luk Van de Velde (Microsoft Belgium and Luxembourg)

 

Weten dat je niet weet wat je zou moeten weten - Michaël Brands (i.Know)

Ondernemingen en organisaties bezitten, beheren en genereren tera- en zelf petabytes aan data, die vaak van onschatbare waarde zijn. Om met die massa aan gegevens om te gaan, gebruiken ze een gamma analytische instrumenten, en niet zonder succes. Die toepassingen analyseren hun gegevens, wat resulteert in allerhande indrukwekkende sheets en overzichten. Die huidige methodologie voor analyse is voornamelijk kwantitatief gericht. Het resultaat van die kwantitatieve analyse is een gigantisch overzicht van allerlei getallen, parameters en percentages die de gegevensmassa voorstellen en samenvatten. Zij focussen op naakte feiten. Een kwantitatieve focus heeft evenwel geen oog voor de inhoud en informatie die achter die getallen en parameters zit: informatie en kennis die vervat zit in doorlopende tekst, rapporten en e-mails. Op die manier negeert men een hele hoop cruciale informatie. De meest relevante gegevens zitten immers vaak in 'niet-kwantitatieve', ongestructureerde documenten. i.Know's taaltechnologie verlegt het zwaartepunt van kwantitatief naar kwalitatief. Door niet alleen in te zoomen op concepten, maar allereerst oog te hebben voor de relaties in ongestructureerde data en teksten die die concepten verbinden, worden in een kwalitatieve analyse de relaties en links tussen de feiten blootgelegd, geïndexeerd, geanalyseerd en gestroomlijnd. Via Smart Indexing over Information Forensics naar Knowledge Streaming. Of hoe ongestructureerde data door semantische technologie tot kennis gestroomlijnd worden. Op die manier helpt taaltechnologie problemen oplossen die door klassieke Business Intelligence gedetecteerd zijn.

klik hier voor de presentatie

Elke vraag is een antwoord - Marja Aangeenbrug (LogicaCMG)

Grote customer contact centers zijn steeds vaker georganiseerd rond agentgroepen die klantvragen over een specifiek expertisegebied kunnen beantwoorden. Dit maakt de opleiding van agenten sneller en goedkoper, en deze aanpak optimaliseert de kans dat klanten efficiënt geholpen worden. Dit is prettig voor klanten, en efficiënt voor het customer contact center. Helaas komen klanten niet altijd bij de juiste agentgroep terecht. Klanten moeten immers nog vaak door toetsgestuurde keuzemenu's navigeren waarvan de keuzes gedefinieerd worden door de organisatie. Deze keuzes sluiten soms niet aan bij de verwachting van de klanten. Dit kan tot verkeerde keuzes leiden en uiteindelijk ook tot telefoontjes die bij de verkeerde agenten belanden. Deze agenten moeten de klanten vervolgens doorverbinden naar een agent die de vraag wel kan beantwoorden. Dit is niet prettig voor de klant, en het is een kostenpost voor call centers. Deze problemen kunnen verholpen worden met een alternatief voor toetsgestuurde keuzemenu's: spraakrouteren. Hierbij stellen klanten een vraag, en worden ze automatisch verbonden met een geschikte agent. Dit vermindert het aantal doorverbindingen. Op basis van de analyse van klantvragen kan een bedrijf verder de organisatie van agentgroepen optimaliseren zodat deze aansluit bij de verwachting en de vragen van klanten, en zodat de efficiëntie van de agenten verder vergroot wordt.

klik hier voor de presentatie

Tekst omzetten in nuttige informatie - Peter De Bie (SAP Business Objects)

Informatiebronnen in natuurlijke taal zijn tot nu toe veelal onzichtbaar gebleven voor traditionele business intelligence systemen, die gestructureerde informatie vereisen. Met tekstanalyse kunnen we echter nuttige metadata zoals entiteiten, feiten, categoriëen en zelfs de gevoelens van de klanten jegens produkten of diensten automatisch extraheren . Deze metadata kunnen we dan gebruiken in raporten, dashboards en andere visualisaties om trends en correlaties uit de gegevens naar voor te laten komen.

klik hier voor de presentatie

Informatiemarkt

Ter gelegenheid van Taal in Bedrijf wordt in de cateringruimte (waar de koffiepauzes, netwerklunch en afsluitende receptie worden gehouden) plaats voorzien voor een "informatiemarkt". Anders dan bij de voorgaande editie(s) van Taal in Bedrijf het geval was, wordt deze informatiemarkt geen echte "bedrijfsmarkt/demonstratieruimte". Daarvoor is de beschikbare ruimte te beperkt in oppervlakte en vermoedelijk ook te "rumoerig" voor (spraak)demo's. Bovendien komen tijdens de themagebonden parallelle sessies in de voormiddag al een aantal specifieke demo's aan bod.

De informatiemarkt op 19 november kan dan ook eerder worden gezien als een soort van "netwerkcafé" waar (vooral tijdens de koffiepauzes, lunch en receptie) contacten kunnen worden gelegd en informatie kan worden uitgewisseld. Enkele (STEVIN-)relevante overkoepelende organisaties in Vlaanderen en Nederland, onder meer de Centrale voor Taal- en Spraaktechnologie (TST-Centrale), de FWO-onderzoeksgemeenschap Computational Linguistics In Flanders (CLIF), de Nederlandse Organisatie voor Taal en Spraaktechnologie (NOTaS) en de Nederlandse Taalunie, zullen alvast aanwezig zijn in het "netwerkcafé".

Daarnaast is er wel nog - doorlopend - gelegenheid voor het geven (en bespreken) van "spontane" demo's in een apart (geluidsarm) lokaaltje, waar een aantal statafels en uiteraard ook Internetconnectie beschikbaar worden gesteld. Bedoeling is dan wel dat degene die een demo wenst te geven deze zelf "pasklaar" op een (eigen) laptop meebrengt. U hoeft zich niet speciaal te registreren indien u van deze gelegenheid gebruik wenst te maken, maar enkel een seintje te geven aan

name = "erwin.dewallef"; server = "ewi.vlaanderen.be"; document.write(""); document.write("Erwin Dewallef (EWI)"); document.write(""); //-->

zodat wij dit verder (organisatorisch) kunnen opvolgen.

Organisatie

Taal in Bedrijf wordt georganiseerd in het kader van het Vlaams-Nederlandse STEVIN-programma. STEVIN is een meerjarig onderzoeks- en stimuleringsprogramma voor Nederlandstalige taal- en spraaktechnologie dat gezamenlijk wordt gefinancierd door de Vlaamse overheid (Departement Economie, Wetenschap en Innovatie van de Vlaamse Regering) en de Nederlandse overheid (OCW, NWO en EZ). Doel van het programma is het stimuleren van de taal- en spraaktechnologische sector in Vlaanderen en Nederland, zodat de innovatiecapaciteit van deze sector wordt vergroot en tegelijkertijd ook de positie van het Nederlands in de moderne informatie- en communicatiemaatschappij wordt versterkt. STEVIN wordt gecoördineerd en financieel beheerd door de Nederlandse Taalunie.

De organisatie van Taal in Bedrijf ligt in handen van EWI (Departement Economie, Wetenschap en Innovatie van de Vlaamse overheid) en de Nederlandse Taalunie.

Met vragen over Taal in Bedrijf kunt u terecht bij

name1 = "peter.spyns"; name2 = "erwin.dewallef"; server = "ewi.vlaanderen.be"; document.write(""); document.write("Erwin Dewallef (EWI)"); document.write(""); document.write(" en "); document.write("Peter Spyns (EWI, NTU)"); document.write(". "); //-->

Deelnemers

Taal in Bedrijf is een ontmoetingsplatform voor investeerders, managers, bestuurders, wetenschappers én vooral de gebruikers.

Ook in 2008 komt dit mooi tot uiting in de deelnames. In totaal hadden zich 185 personen geregistreerd. 158 personen heben zich effectief aangemeld (Vlaanderen:86 en Nederland:72). Ze behoren tot 101 verschillende organisaties uit Vlaanderen (56) en Nederland (45).

  • Advanced Bionics (1)
  • Artesis Hogeschool Antwerpen (2)
  • BLCC (3)
  • CCL - K.U.Leuven (2)
  • Commart International (2)
  • Cross Language NV (2)
  • Crossminder (1)
  • Departement vertaalkunde, Hogeschool Gent (1)
  • ElaN Languages (1)
  • ELANEX Belgium (1)
  • ELCS (1)
  • Erasmushogeschool Brussel
  • Erasmushogeschool Brussel (2)
  • European Research Council (1)
  • Fortis Bank nv/sa (1)
  • FWO (1)
  • HMC NV (2)
  • Hogeschool Gent (2)
  • i.Know NV (2)
  • IBBT (1)
  • ICMS (1)
  • iForumConsult (1)
  • in eigen naam (1)
  • Instituut voor Nederlandse Lexicologie (2)
  • IWT (2)
  • Jabbla (1)
  • K.U.Leuven (9)
  • Language and Computing (1)
  • Lessius Hogeschool (1)
  • Linguapolis (1)
  • Lionbridge (1)
  • Mentoring Systems BVBA (1)
  • Microsoft BeLux (1)
  • MODEM (1)
  • Natlanco (1)
  • Nuance Communications International (2)
  • Prompt! Spraaktoepassingen (1)
  • RIZIV (federale overheid) (1)
  • SAP Business Objects (1)
  • Sensotec NV (1)
  • Stichting Nederlands (1)
  • Synergetics (1)
  • Tele Atlas (1)
  • Televic Education (1)
  • Ubisoft (1)
  • UGent (1)
  • UGent, DSSP, ELIS (2)
  • Universiteit Antwerpen (1)
  • VDAB (5)
  • Vlaamse overheid - Departement Diensten voor het Algemeen Regeringsbeleid (1)
  • Vlaamse overheid - Departement Economie, Wetenschap en Innovatie (6)
  • Vlaamse overheid - Landbouw en Visserij (1)
  • Vrije Universiteit Brussel (1)
  • VRT (1)
  • VRT-medialab (2)
  • Xplanation Language Services (2)
  • Bosk (1)
  • Centre for Language and Speech Technology (CLST) (1)
  • Cimico (1)
  • CINOP (1)
  • CumLingua (1)
  • Dedicon (1)
  • Dialogs Unlimited BV (1)
  • DutchEar (1)
  • Fluency (1)
  • GridLine bv (1)
  • IB-Groep (4)
  • KleurRijker (1)
  • KPN (1)
  • Linguistic Systems BV (1)
  • Logica (3)
  • M&I/Partners (1)
  • Miniserie van Buitenlandse Zaken (1)
  • Minsterie van Onderwijs, Cultuur en Wetenschap (1)
  • Nederlandse Organisatie voor Wetenschappelijk Onderzoek (1)
  • Nederlandse Taalunie (4)
  • NFI (3)
  • NWO (1)
  • Parabots B.V. (1)
  • Polderland Language & Speech Technology bv (1)
  • Q-go (1)
  • Rabobank (1)
  • Rijksuniversiteit Groningen (4)
  • Senternovem (3)
  • Sint Maartenskliniek (1)
  • Sint Maartenskliniek RD&E (2)
  • Steunpunt Nederlandstalige Terminologie / VU (1)
  • Taalcentrum-VU (1)
  • Technische Universiteit Delft (1)
  • Telecats / Universiteit Twente (1)
  • Telecats bv (1)
  • Telematica Instituut (1)
  • Textkernel BV (1)
  • TNO (1)
  • TomTom International b.v. (1)
  • TST-Centrale/INL (4)
  • Universiteit Utrecht (2)
  • Universiteit van Tilburg (2)
  • Van Dale Uitgevers (2)
  • VoiceCorp (3)
  • Vrije Universiteit Amsterdam (1)

Locatie

Taal in Bedrijf 2008 vindt plaats in hotel Husa President Park in Brussel.

Tien kamers (aan 140 euro) worden voorbehouden voor deelnemers aan Taal in Bedrijf. De optie op deze kamers (18 en 19 november) verloopt op 31 oktober. U dient zelf met het hotel en te vermelden dat u deelneemt aan Taal in Bedrijf. De reservatiecode is Vlaamse Overheid/NTU. Nadien blijft hetzelfde tarief gelden voor zover er nog kamers beschikbaar zijn.

Verder beschikt het hotel over 40 parkeerplaatsen (tarief: 1,24 euro per uur of 12,40 euro per dag). Een parkeerplaats kan niet op voorhand gereserveerd worden. Rij met de wagen tot voor de poort en deze gaat vervolgens automatisch open.

Het adres is Koning Albert II-laan 44, 1000 Brussel. Klik voor een kaartje of stippel je route uit.

Het hotel ligt op ongeveer tien minuten stappen van het station Brussel Noord. De locatie is dus uiterst makkelijk te bereiken met het openbaar vervoer.

  • De HST/Thalys vanuit/naar Nederland stopt/vertrekt enkel in Brussel Zuid. Er zijn vanuit Brussel Zuid vele treinen die langs Brussel Noord passeren (en omgekeerd).
  • De HiSPeed internationale trein Brussel-Amsterdam komt aan in Brussel Noord om 8u36, 9u36 enz. en vertrekt er om 17u24, 18u24 enz. Bij vertrek richting Nederland passeert deze niet meer langs Brussel Zuid.

Details over de treinendienstregeling vindt u via de web site van de NMBS. Een HST-ticket is niet geldig voor de HiSPeed-trein en omgekeerd.

 

7 januari 2016