taalunieversum

Direct naar menu
U bent hier: start » taal » technologie »

taal- en spraaktechnologienieuws apr'07

Taal- en spraaktechnologienieuws april 2007 
*******************************************
  
0. TST op de agenda 
1. Themadag TST-centrale: stages in de TST-sector (Utrecht, 23/5)
2. Nederlandse Taalunie richt terminologiesteunpunt op
3. TST-centrale lanceert update e-Lex en nieuwe product sheets
4. Snelle opmars spraakherkenning in contactcenters
5. Hotel reserveren met spraakherkenning 
6. Strategische samenwerking Telisma en Dutchear
7. Website (ver)taaltechnologieteam Hogeschool Gent
8. Afstudeerstage emotionele spraaksynthese (TNO Soesterberg)
9. Training fellowships in Sound to Sense-netwerk
10. Vacature postdoc memory-based language modeling & MT (Tilburg)
11. Diverse vacatures promovendi CLCG (Groningen)
12. Vacature onderzoeksmedewerker toegep. communicatie (Antwerpen)

Heeft u ook een nieuwsbericht of een aankondiging, dan vernemen wij 
dat graag (sluitingsdatum volgend nummer: 2/5/7). Deze en voor- 
gaande edities van Taal- en spraaktechnologienieuws zijn on-line 
beschikbaar op 
http://taalunieversum.org/taal/technologie/nieuwsbrief/. 
  
==================================================================== 
U ontvangt dit bericht omdat uw gegevens zijn opgenomen in de taal- 
en spraaktechnologiedatabank van de Nederlandse Taalunie 
(www.taalunieversum.org/tst). Wijzigingen voor deze databank kunt u 
melden via tst@taalunie.org - dank u wel! 
==================================================================== 
  
-------------------------------------------------------------------- 

0. TST op de agenda 
******************* 

� Europese Top Tekstanalyse
(26/04/2007 tot 27/04/2007 in Amsterdam)

� Symposium Virtuele communicatieondersteuning
(28/04/2007 in Leuven)

� Colloquium Taal en Spraak: biometrie
(09/05/2007 in Nijmegen)

� Belgisch-Nederlandse conferentie Machine Learning (Benelearn07)
(14/05/2007 tot 15/05/2007 in Amsterdam)

� Stagedag voor studenten taal en spraak
(23/05/2007 in Utrecht)

� Colloquium Taal en Spraak: leren
(06/06/2007 in Nijmegen)

� LOT-cursus Uitspraak en automatische spraakherkenning
(11/06/2007 tot 15/06/2007 in Leuven)

� LOT-cursus Zelflerende systemen in de psycholingu�stiek
(11/06/2007 tot 15/06/2007 in Leuven)

Zie: http://www.taalunieversum.org/tst/ 
  
-------------------------------------------------------------------- 

1. Themadag TST-centrale: stages in de TST-sector (Utrecht, 23/5)
*****************************************************************

Ooit wel eens over nagedacht wat je allemaal kunt met je taal- of 
spraakstudie? Tijd om stage te lopen maar je weet nog niet waar? Op 
de themadag van de TST-centrale bieden verschillende taal- en 
spraaktechnologiebedrijven een kijkje in de praktijk. De 
ontwikkeling van taal- en spraaktechnologie is groeiend en er zijn 
mensen met veel uiteenlopende achtergronden aan het werk. Of je nu 
kunstmatige intelligentie, informatiekunde of taalwetenschap 
studeert, in de TST is er altijd wel een plekje voor je te vinden. 

Op 23 mei krijg je de gelegenheid om kennis te maken met deze 
wereld. Stagiairs en medewerkers van bedrijven zoals Q-go, Dutchear 
en Textkernel komen vertellen over hun ervaringen in de TST. 
Daarnaast worden er vacante stageplaatsen aangeboden en staan er 
bedrijven op de informatiemarkt waar je persoonlijk vragen kunt 
stellen. Wil je jouw toekomst een stapje voor zijn, kom dan naar de 
stagedag van de TST-centrale in Utrecht!

Plaats: Hogeschool Domstad, Utrecht
Toegang: gratis

Het programma wordt zo spoedig mogelijk bekend gemaakt op de 
website.

Wilt u vanuit uw organisatie of bedrijf een stand op de 
informatiemarkt verzorgen? Stuur dan voor aanmelding een e-mail naar 
tst-info@inl.nl.

De TST-centrale is een initiatief van de Nederlandse Taalunie.

Zie: http://www.tst.inl.nl/
  
-------------------------------------------------------------------- 

2. Nederlandse Taalunie richt terminologiesteunpunt op
******************************************************

Sinds 1 april jl. is er een Steunpunt Nederlandstalige Terminologie 
(SNT). Het Steunpunt geeft informatie en advies over alle aspecten 
van Nederlandstalige terminologie. Verder voert het projecttaken uit 
voor de Vlaams-Nederlandse terminologievereniging NL-Term en voor de 
Commissie Terminologie. Deze Commissie houdt zich bezig met de 
voorbereiding van het terminologiebeleid van de Taalunie. Dat beleid 
is vooral gericht op de ontwikkeling van elektronische hulpmiddelen.

De verantwoordelijkheid voor het Steunpunt ligt bij een 
samenwerkingsverband van twee organisaties: de Vrije Universiteit 
Amsterdam en het taaltechnologische bedrijf Cross Language nv uit 
Gent. De Taalunie heeft hiertoe besloten na een openbare 
aanbestedingsprocedure.

Gebruikers van terminologie kunnen bij het Steunpunt terecht met al 
hun vragen. Als het Steunpunt niet zelf kan antwoorden, verwijst het 
door naar de juiste instantie. Het Steunpunt geeft ook advies op 
maat aan bedrijven of organisaties, vertalers, terminologen, 
docenten en vakexperts. Bovendien kan het Steunpunt helpen bij het 
zoeken van partners, applicaties, terminologiecollecties en 
dergelijke. 

Het Steunpunt onderhoudt in opdracht van de Nederlandse Taalunie de 
website www.nedterm.org. NedTerm is een onderdeel van het 
Taalunieversum, de website van de Taalunie. NedTerm geeft informatie 
over alles wat er in Nederland en Vlaanderen op het gebied van 
terminologie bestaat en gebeurt.

De Taalunie wil met de oprichting van het Steunpunt bijdragen aan 
een betere professionele ondersteuning van het terminologiewerk in 
Vlaanderen en Nederland en tot een stroomlijning van de informatie- 
en documentatie op dit terrein. 

Zie: http://www.nedterm.org/
  
-------------------------------------------------------------------- 

3. TST-centrale lanceert update e-Lex en nieuwe product sheets
**************************************************************

De TST-centrale beschikt over e-Lex, een lexicale databank van het 
Nederlands, met circa 220.000 trefwoorden en meer dan 600.000 
woordvormen. De ingangen (entry�s) van het lexicon zijn voorzien van 
morfologische, syntactische en fonologische informatie. Een deel van 
de trefwoorden is ook voorzien van semantische informatie. Het is 
een breed inzetbaar computationeel lexicon voor de ontwikkeling van 
taal- en spraaktechnologische applicaties. 

In de periode van november 2006 tot februari 2007 heeft een update 
van het lexicon plaatsgevonden. De kolommen 'lem' (lemma) en 
'wordf' (woordvorm) zijn automatisch op fouten onderzocht en 
vervolgens handmatig gecorrigeerd. Dit heeft geresulteerd in e-Lex 
versie 1.1.

Daarnaast heeft de TST-centrale vier nieuwe Product Sheets van 
beschikbare TST-producten op haar website geplaatst: het 5 Miljoen 
Woorden Krantencorpus, het 27 Miljoen Woorden Corpus 1996, het 38 
Miljoen Woorden Corpus en e-Lex 1.1. De Product Sheets geven zowel 
inhoudelijke als technische informatie zo beknopt en duidelijk 
mogelijk weer. U kunt het pdf-bestand downloaden door naar het 
betreffende product in de productenlijst te gaan. Het bestand is 
tevens geschikt om af te drukken.

In de toekomst wordt voor elk product van de TST-centrale een 
Product Sheet gemaakt. Zo heeft u per product alle essenti�le 
informatie in een beknopt en overzichtelijk document op een rij! 

De TST-centrale is een initiatief van de Nederlandse Taalunie.

Zie: http://www.tst.inl.nl/
  
-------------------------------------------------------------------- 

4. Snelle opmars spraakherkenning in contactcenters
***************************************************

Van alle contactcenters maakt 13,5 procent gebruik van 
spraakherkenning, terwijl 24,7 procent plannen heeft om deze 
technologie te implementeren. Dit blijkt uit het Global Contact 
Centre Benchmarking-onderzoek 2007 van Dimension Data, dat op 19
maart is verschenen.

De stijgende populariteit van technologie voor spraakherkenning is 
een logisch vervolg op reeds breed ingezette online 
selfservicemogelijkheden in contactcenters. Aangezien voor veel 
mensen spraak de meest voor de hand liggende vorm van communicatie 
is, voorspelt het Benchmarkingonderzoek 2007 dat organisaties steeds 
vaker spraaktechnologie�n zullen inzetten om eenvoudige 
contactcentervragen af te handelen. Gebruikers zullen deze 
technologie op grote schaal gebruiken, waardoor de effici�ntie 
aanzienlijk te verbeteren is. In de reis- en transportsector is het 
aantal bedrijven dat overweegt om in de komende achttien maanden 
spraaktechnologie in te zetten het grootst; bijna de helft van de 
bedrijven (41,9 procent) is dit van plan.

Volgens Cara Diemont, auteur van het Dimension Data Global 
Contact Center Benchmarking Report, levert selfservice op basis van 
spraak in een contactcenter grote voordelen op: "Bedrijven
profiteren hier enorm van. Met een gedegen implementatie zullen 
grote aantallen klanten een beroep doen op spraakselfservice. Als 
organisaties deze service bovendien toepassen voor de juiste 
processen, vergroten ze hun effici�ntie en realiseren ze 
besparingen. Ook klanten plukken de vruchten van deze mogelijkheid, 
bijvoorbeeld omdat de dienst 24x7 beschikbaar is." Andere
voordelen voor klanten zijn snellere servicetoegang en het ontbreken 
van wachtrijen.

Zie: http://www.dimensiondata.com/nl/
  
-------------------------------------------------------------------- 

5. Hotel reserveren met spraakherkenning
****************************************

Horecaconcern Van der Valk Hotels & Restaurants is een nieuwe dienst 
gestart: Valkmobiel.nl Geregistreerde klanten kunnen 0900-456VALK 
(0900-4568255) bellen om een kamer, zaal of tafel bij Van der Valk 
te reserveren. De reservering gaat dan via een 
spraakherkenningsysteem dat geleverd is door Telecats, aanbieder van 
voice response en spraakherkenningtoepassingen ten behoeve van het 
automatiseren van telefoongesprekken en Voice over IP oplossingen.

Al enige tijd biedt Van der Valk Hotels & Restaurants aan grote 
bedrijven en organisaties de mogelijkheid om een corporate 
overeenkomst aan te gaan. De medewerkers kunnen dan tegen vooraf 
afgesproken condities overnachten, lunchen/dineren of vergaderen bij 
de vestigingen van Van der Valk Hotels & Restaurants. Het boeken van 
de kamer, zaal of tafel gaat via een spraakherkenningtoepassing die 
is gemaakt door Telecats. De klant geeft door simpelweg de vragen te 
beantwoorden de reservering door.

Deze spraakherkenningtoepassing is nu ook beschikbaar voor 
individuele gebruikers. Belangstellenden kunnen, na online 
registratie, met hun mobiele telefoon binnen 2 minuten een kamer 
reserveren.

Gerard Schomaker, general manager Van der Valk Internet: "We 
verwachten dit jaar 5% van alle online boekingen via deze dienst te 
realiseren. We zijn de eerste horecaorganisatie die met deze nieuwe 
technologie operationeel is."

Zie: http://www.telecats.nl/

-------------------------------------------------------------------- 

6. Strategische samenwerking Telisma en Dutchear
************************************************

Telisma recently joined forces with Dutchear, the Dutch speech 
applications expert, to provide high quality speech driven telephony 
applications. Through the signature of a VAR agreement, Dutchear now 
resells the teliSpeech technology, integrating in its offer the 
newly improved version of its Dutch engine. This version benefits 
from months of optimisation and tuning based upon an extensive real-
life speech database, which translates into top recognition rates. 
The joint solution will be called upon to implement corporate speech 
services, such as automated call centres and corporate directory 
assistance in the Dutch speaking market. In particular, it will rely 
on telisma's ability to deal with extra-large vocabularies to 
address the mass market, namely the automated information services 
or complex self-service applications.

Also, thanks to the telisma�s tool kits which allow for rapid and 
easy creation of dialects, Dutchear is now able to address the 
Flemish speaking market. Using the teliSpeech Tuning Tool Kit 
Advanced Edition (TTK AE), Dutchear can create in no time a specific 
dialect to fit this specific Belgian accent, pronunciation and 
vocabulary, by enhancing the Dutch on both the acoustic and lexical 
levels. 

According to Victor Huisman, CEO Dutchear: "We have run a battery of 
tests on the newly introduced telisma Dutch language and are really 
enthusiastic with the performance of teliSpeech. As a speech 
recognition integrator we are continually looking for speech 
recognition performance and quality improvement. With teliSpeech, we 
have found the right technology to go further in performance."

Laurent Balaine, telisma CEO, commented: "The alliance with 
Dutchear, an expert speech recognition player with a strong 
understanding of customer requirements is great news for telisma." 

Zie: http://www.dutchear.nl/

-------------------------------------------------------------------- 

7. Website (ver)taaltechnologieteam Hogeschool Gent
***************************************************

Het LT3 (Language and Translation Technology Team) taal- en 
vertaaltechnologieteam is een jonge onderzoeksgroep ingebed in het 
Departement Vertaalkunde van de Hogeschool Gent. De groep heeft een 
aparte website geopend. Het gezamenlijke team werd pas boven het 
doopvont gehouden in de loop van 2006, maar het kan bogen op een 
brede ervaring van het departement op het gebied van terminologisch 
en vertaalkundig onderzoek. Door een bijkomende prioritaire focus op 
de ontwikkeling van parallelle corpora en op corpusgebaseerd taal- 
en vertaaltechnologisch onderzoek is het onderzoek van het team nu 
opgebouwd rond de volgende drie pijlers:

* Terminologie: terminologisch en terminografisch onderzoek en 
opbouw van termenbanken 

* Parallelle corpora: aanleg van parallelle corpora voor 
vertaalkundig en vertaaltechnologisch onderzoek 

* Technologie: (ver)taaltechnologisch onderzoek en ontwikkeling van 
corpusgebaseerde taal- en vertaaltechnologische applicaties 

Contactpersoon voor het domein taaltechnologie is dr. V�ronique Hoste.

Zie: http://veto.hogent.be/lt3/

-------------------------------------------------------------------- 

8. Afstudeerstage emotionele spraaksynthese (TNO Soesterberg)
*************************************************************

Binnen de afdeling Human Interfaces van TNO Defensie en Veiligheid 
in Soesterberg wordt onderzoek gedaan naar mens-machine interfaces. 
Een onderdeel van zo�n interface kan zijn het automatisch omzetten 
van tekst naar spraak (spraaksynthese). In de meeste commerci�le 
spraaksynthese-programma�s is het niet mogelijk om de spraak te 
voorzien van emotie. Doel van dit onderzoek is om te onderzoeken in 
hoeverre met bestaande 'open-source' of commerci�le spraaksynthese 
systemen emotionele spraak te genereren of te manipuleren is.

De stage bestaat uit twee fases: een literatuurstudie en een 
luisterexperiment. In de literatuurstudie zal onderzocht worden 
welke akoestische parameters correleren met emotie. Hierbij wordt 
gebruik gemaakt van een dimensioneel model van emotie (dimensies: 
valence, activation en evt. power). Er zal bekeken worden of het 
mogelijk is om met bestaande 'open-source' of commerci�le 
spraaksynthe-software de relevante akoestische parameters te 
manipuleren. In het luisterexperiment zal onderzocht worden of 
manipulatie van het spraaksignaal het gewenste effect heeft op de 
perceptie van de emotiedimensie(s).

Wat vragen we van jou?
� een opleiding op universitair niveau; bij voorkeur fonetiek, 
taalwetenschap, kunstmatige intelligentie, natuurkunde, wiskunde of 
informatica
� kennis en ervaring met signaalbewerkingsalgorithmen
� in bezit van een paspoort van een NAVO lidstaat (i.v.m. screening)
� beheersing Nederlands (i.v.m. Nederlandse spraaksynthese)
� affiniteit met onderzoek
� zelfstandig kunnen werken
� een collegiale instelling met bijbehorende communicatieve 
vaardigheden
� je bent ondernemend en initiatiefrijk

Meer informatie bij Judith Kessens, judith.kessens@tno.nl.

-------------------------------------------------------------------- 

9. Training fellowships in Sound to Sense-netwerk
*************************************************

Sound to Sense (S2S) is a Marie Curie Research Training Network 
involving collaborative speech research amongst 13 universities in 
10 countries. 18 Training Fellowships are available, of which 12 are 
predoctoral and 6 postdoctoral (or equivalent experience). Most but 
not all are planned to start in September or October 2007.

A research training network's primary aim is to support and train 
young researchers in professional and inter-disciplinary scientific 
skills that will equip them for careers in research. S2S's 
scientific focus is on cross-disciplinary methods for modelling 
speech recognition by humans and machines. Distinctive aspects of 
our approach include emphasis on richly-informed phonetic models 
that emphasize communicative function of utterances, multilingual 
databases, multiple time domain analyses, hybrid episodic-abstract 
computational models, and applications and testing in adverse 
listening conditions and foreign language learning.

Eleven projects are planned. Each can be flexibly tailored to match 
the Fellows' backgrounds, research interests, and professional 
development needs. Two projects are planned to be hosted in the 
Netherlands and one in Flanders:
- Automatic methods to identify FPD: Corpus-based probabilistic work 
(Radboud U, Nijmegen; Baayen, Svendsen)
- Lexical decoding of speech using sub-phonemic features
(Radboud U, Nijmegen; ten Bosch, Moore)
- Hybrid episodic-abstract computational modelling: ASR
(Katholieke U, Leuven; Van Compernolle, Moore)

There is no deadline for applications, but applications received by 
1st May 2007 will be considered by mid-May.

Zie: http://www.ling.cam.ac.uk/s2s/s2sJobAd.pdf

-------------------------------------------------------------------- 

10. Vacature postdoc memory-based language modeling & MT (Tilburg)
******************************************************************

The Induction of Linguistic Knowledge research group of Tilburg 
University's Department of Communication and Information Sciences 
(Faculty of Humanities) has an opening for a full-time postdoc 
researcher (three years). Application deadline: April 20, 2007.

The position, funded by the Netherlands Organization for Scientific  
Research (NWO), is part of the Vici project "Implicit linguistics: 
Machine learning of text-to-text processing", focusing on memory-
based language modeling and machine translation. Memory-based 
language modeling is a classification-based take on the classical 
problem of predicting the next or the missing word in a sequence, 
and has applications ranging from spelling correction to language 
modeling for speech recognition and machine translation. Memory-
based machine translation, analogously, is a new classification-
based implementation of example-based machine translation. 
Underlying both goals is the development of highly scalable and 
parallelizable memory-based classifiers (based on the TiMBL class of 
algorithms developed at Tilburg University) trained on very large 
monolingual and bilingual textual corpora.

We are looking for an enthusiastic researcher to complete the five- 
person team for this project, which also consists of a Ph.D. 
student, two part-time scientific programmers, and project leader 
Antal van den Bosch. The person to do this should have a PhD in 
computational linguistics, computer science, or a related area, 
preferably with a strong track record in machine learning of natural 
language, or in data-driven methods for machine translation. 
Programming skills and a good command of English (both spoken and 
written) are required. The project calls for an all-round team
player who knows how to do fundamental research, who likes creating 
natural language processing software, and who enjoys coaching 
students and junior researchers.

Zie: http://ilk.uvt.nl/jobs/ilk2007-vici/

-------------------------------------------------------------------- 

11. Diverse vacatures promovendi CLCG (Groningen)
*************************************************

The Center for Language and Cognition Groningen (CLCG) announces 
eight graduate fellowships (all PhD positions). The positions are 
open to qualified applicants from all over the world. Naturally, 
Dutch citizens are also eligible for these fellowships. The 
positions will preferentially be filled in one of the following 
research groups: 
- computational linguistics 
- neurolinguistics 
- language variation and language change.
Application deadline: May 1, 2007.

The CLCG also announces two PhD positions (90%) in Modelling 
Discourse Structure. The successful candidates will 
participate in the NWO-funded research programme 'Modelling 
Discourse Structure'. This programme investigates the hierarchical 
organisation of textual units into structured entities by the joint 
contributions of relational coherence (the way smaller textual units 
combine into larger ones) and lexical cohesion (relations between 
elements within textual units, e.g., synonyms, anaphora, or 
collocations). Corpora from different genres (journalistic, 
encyclopaedic, and persuasive texts) will be investigated to take 
into account genre-dependent differences in textual organisation. 
Application deadline: May 5, 2007.

Finally, the following position is still open: PhD position (90%) 
in Applications of Algorithms for Linguistic Processing in Action: 
Dutch. In the recently completed PIONIER research project Algorithms 
for Linguistic Processing, a collection of related techniques and 
tools for wide-coverage computational analysis of Dutch have been 
developed. In the current project, we seek answers to advanced 
research questions in the area of the computational analysis of 
Dutch, building on the results of the earlier project.

Zie: 
http://www.rug.nl/let/onderzoek/onderzoekinstituten/clcg/positions/

-------------------------------------------------------------------- 

12. Vacature onderzoeksmedewerker toegep. communicatie (Antwerpen)
****************************************************************** 

In het kader van een onderzoeksproject van de Vakgroep Zakelijke 
Communicatie (Faculteit Toegepaste Economische Wetenschappen - 
Departement management) van de Universiteit Antwerpen in 
samenwerking met het Hoger Instituut voor Vertalers en Tolken 
(Hogeschool Antwerpen) is de volgende voltijdse onderzoeksplaats 
vacant:

Onderzoeksmedewerker Toegepaste Communicatie
Live ondertiteling met spraaktechnologie

Het betreft een tijdelijke aanstelling voor een termijn van 15 tot 
17 maanden, in het statuut van Dehousse-bursaal (startdatum augustus 
2007).

U verricht wetenschappelijk onderzoek dat kan leiden tot een 
proefschrift. Het thema van het onderzoek is 'Live-ondertiteling met 
spraaktechnologie: Procedure voor kwaliteitsverbetering'. Het 
betreft een project van de Associatie Antwerpen met samenwerking 
tussen het Hoger Instituut voor Vertalers en Tolken (HIVT), de 
Universiteit Antwerpen (Dept. Management) en de VRT. Een uitgewerkt 
onderzoeksvoorstel vormt de basis van de aanstelling (verkrijgbaar 
op aanvraag). U besteedt minimaal 80% van uw tijd aan 
wetenschappelijk onderzoek. U verleent (beperkte) assistentie bij 
het onderwijs. 

Solliciteren kan tot 1 mei 2007.

Zie: http://www.ua.ac.be/main.aspx?c=*VACATURES

-------------------------------------------------------------------- 
© Nederlandse Taalunie, 2000-2009 alle rechten voorbehouden
WegwijzerColofonContactVrijwaringOpmerkingen en reacties