taalunieversum

Direct naar menu
U bent hier: start » taal » technologie »

taal- en spraaktechnologienieuws feb'07

Taal- en spraaktechnologienieuws februari 2007 
********************************************** 
  
0. TST op de agenda 
1. STEVIN: zes demonstratieprojecten goedgekeurd
2. Lezingen over taaltechnologietoepassingen (Leuven, 12/2-8/3)
3. Symposium over virtuele communicatieondersteuning (Leuven, 28/4)
4. N-Best 2008: Oproep voor deelname aan evaluatie spraakherkenners
5. Is de computer een goed verstaander?
6. Interview met Markus Egg over computationeel discourse-onderzoek
7. WNT gratis op internet raadpleegbaar
8. Acapela en Assistiveware lanceren TextParrot
9. Oproep voor bijdragen over zangsynthese 
10. Vacature promovendus ACORNS-project CLST (RU Nijmegen)
11. Vacatures computerlinguist en student-assistenten (K.U. Leuven)

Heeft u ook een nieuwsbericht of een aankondiging, dan vernemen wij 
dat graag (sluitingsdatum volgend nummer: 2/3/7). Deze en voor- 
gaande edities van Taal- en spraaktechnologienieuws zijn on-line 
beschikbaar op 
http://taalunieversum.org/taal/technologie/nieuwsbrief/. 
  
==================================================================== 
U ontvangt dit bericht omdat uw gegevens zijn opgenomen in de taal- 
en spraaktechnologiedatabank van de Nederlandse Taalunie 
(www.taalunieversum.org/tst). Wijzigingen voor deze databank kunt u 
melden via tst@taalunie.org - dank u wel! 
==================================================================== 
  
-------------------------------------------------------------------- 

0. TST op de agenda 
******************* 

Colloquium Taal en Spraak: muziek en perceptie  
� 07/03/2007 in Nijmegen

Nederlands-Belgische workshop Information Retrieval (DIR2007) 
� 28/03/2007 tot 29/03/2007 in Leuven

Colloquium Taal en Spraak: TST voor kleine talen 
� 04/04/2007 in Nijmegen

Europese Top Tekstanalyse 
� 26/04/2007 tot 27/04/2007 in Amsterdam

Symposium Virtuele communicatieondersteuning 
� 28/04/2007 in Leuven

Zie: http://www.taalunieversum.org/tst/ 
  
-------------------------------------------------------------------- 

1. STEVIN: zes demonstratieprojecten goedgekeurd
************************************************ 

In de tweede ronde voor demonstratieprojecten in het STEVIN-
programma zijn zes projectaanvragen goedgekeurd:

* Audiokrant (Sensotec, De Braillekrant en K.U.Leuven - SCD) - de 
krant voor mensen met een leeshandicap conform de internationale 
Daisy-standaard.

* Spelling- en grammaticacontrole voor dyslectische gebruikers 
(Polderland Language & Speech Technology, Technologie & Integratie 
en Die-'s-lekti-kus) - aanpassing van de standaard spellingcontrole 
en grammaticacontrole in Microsoft Office zodanig dat ze beter 
aansluiten bij de typische fouten die dyslectici maken.

* Rechtspraakherkenning (Telecats en Carp Technologies) -
hulpmiddelen om de tijd aanzienlijk te verkorten die gemoeid is met 
het volledig uitschrijven van de geluidsopnamen in de rechtszaal.

* Klare taal bij de overheid (GridLine, Universiteit Utrecht - UiL 
OTS, K.U.Leuven - CCL, Stichting Toepassing Inductieve 
Leertechnieken, Provincie Brabant en Gemeente Den Haag - Dienst 
Voorlichting en Ext. Betrekkingen) - dynamische jargonbewaker om de 
leesbaarheid van publieksgerichte communicatie van 
overheidsinstellingen te verbeteren.
 
* Spellingchatbot (INL - dependance Vlaanderen, Elitech, Polderland 
Language & Speech Technology, Van Dale Lexicografie) - chatbot die 
direct het juiste antwoord geeft op spellingvragen gesteld via MSN, 
sms of de webbrowser.
 
* Voice Assess (Telecats en VO Consulting) - applicatie voor een 
goede automatische voorselectie van kandidaten voor het werken in 
call centers, waarbij met spraakherkenning gemeten wordt of 
bepaalde essenti�le woorden wel of niet gezegd zijn.
 
Zie: http://www.stevin-tst.org/. 
  
-------------------------------------------------------------------- 
 
2. Lezingen over taaltechnologietoepassingen (Leuven, 12/2-8/3)
***************************************************************

Van 12 februari tot 8 maart 2007 vindt aan de K.U. Leuven een reeks 
van twaalf lezingen plaats over 'Language Engineering Applications'. 
De lezingen zijn toegankelijk voor al wie ze wil bijwonen. Vooraf 
aanmelden is niet nodig.

De volgende onderwerpen komen aan bod:
* corpusconstructie en -annotatie � 12/02/2007
* ontwikkelen van een spraakherkenner - 14/02/2007
* syntactische annotatie � 15/02/2007
* computationele lexicografie - 19/02/2007
* proofing tools � 21/02/2007
* hulpmiddelen voor gehandicapten (1) - 22/02/2007
* het ACORNS-project � 26/02/2007
* meertalige documentgeneratie en MT � 28/02/2007
* hulpmiddelen voor gehandicapten (2) � 01/03/2007
* ontwerp van een leestutor � 05/03/2007
* meertalige document-retrieval - 07/03/2007
* dialoogdescriptie en Voice-XML - 08/03/2007

Zie: http://www.ccl.kuleuven.be/Courses/LEA
  
-------------------------------------------------------------------- 

3. Symposium over virtuele communicatieondersteuning (Leuven, 28/4)
*******************************************************************

Dit symposium handelt over verschillende communicatiemiddelen die 
ingezet kunnen worden voor klinische en educatieve toepassingen. De 
verschillende sprekers zijn experten op gebied van de ontwikkeling 
van virtuele therapeuten voor dyslectische, spraakgestoorde of 
gehoorgestoorde kinderen en volwassenen (zie bijbehorende websites). 
Er zullen diverse demonstraties gegeven worden.

9.00 Inventing virtual teachers and therapists. Ron Cole (University 
of Colorado, USA)
10.30 Pauze
11.00 Tutor that Listens. Jack Mostow (Carnegie Mellon University, 
USA)
12.15 Lunchpauze
13.30 Naar een geautomatiseerde leesvaardigheidsproef voor het 
Nederlands: het SPACE-project. Hugo Van Hamme (ESAT, K.U.Leuven)
14.00 Uitspraakevaluatie & training met behulp van 
spraaktechnologie. Helmer Strik (RU Nijmegen)
14.30 Spraakanalyse en synthese voor bijzondere doelgroepen. Werner 
Verhelst (Vrije Universiteit Brussel)
15.00 Spraak- en taaltechnologie voor Nederlandstalige personen met 
beperkingen: wat is er reeds beschikbaar? Dirk Lembrechts (Modem)
15.30 Einde

Organisatie: Logopedische en Audiologische Wetenschappen K.U.Leuven, 
Lessius Hogeschool Antwerpen, Katholieke Hogeschool Brugge-Oostende.
Inschrijving en betaling v��r 8 april 2007.

Zie: https://gilbert.med.kuleuven.be/web/index.php/Public:Symposium

-------------------------------------------------------------------- 

4. N-Best 2008: Oproep voor deelname aan evaluatie spraakherkenners
*******************************************************************

In 2006 the Dutch research programme STEVIN granted funding to the
project N-Best. This project aims at setting up the infrastructure
for a benchmark evaluation in large vocabulary speech recognition 
for the Dutch language, and at conducting such an evaluation. This 
is a call to the speech recognition research community to 
participate in this evaluation. 

The evaluation is conducted by TNO Human Factors in Soesterberg, the
Netherlands in co-operation with SPEX in Nijmegen. The evaluation
paradigm is similar to that of the well known NIST speech technology
evaluations. The evaluation is scheduled to be held in the spring of
2008, with an optional dry run in September 2007.

Two large vocabulary speech recognition tasks will be covered in the
evaluation data, Broadcast News (BN) and Conversational Telephone
Speech (CTS). Two main dialect regions will be defined in the
evaluation, Northern and Southern Dutch, as spoken by people from 
The Netherlands and Flanders (Belgium), respectively.  

In order to facilitate development of speech recognition systems for
Dutch, sources for acoustic and textual training material have been
located. These are the Spoken Dutch Corpus (Corpus Gesproken
Nederlands, CGN) and text data from Dutch and Flemish newspapers.  
TNO is currently making the effort to streamline obtaining research
licenses to these data for use in N-Best.

The evaluation will be followed by a workshop, in which the results
are presented and participants can present and discuss their 
approach to the evaluation task. One of the goals of the project is 
to produce a journal article describing the evaluation and the 
research approaches taken therein.  

A first evaluation plan with rules and dates is available from the
N-Best evaluation website.

Zie:  http://speech.tm.tno.nl/n-best/eval/.

-------------------------------------------------------------------- 

5. Is de computer een goed verstaander?
***************************************

Een goed verstaander... maakt dit spreekwoord moeiteloos af. Meestal 
is een half woord al voldoende om te begrijpen wat er gezegd wordt. 
In de tentoonstelling "Bent u een goed verstaander?" kunt u zelf 
experimenteren met taal. Van 26 januari t/m 13 mei 2007 is deze 
kleine tentoonstelling over optimale communicatie te bekijken en te 
beluisteren in het Universiteitsmuseum in Groningen. Daarvoor stond 
de tentoonstelling in het Universiteitsmuseum in Utrecht.

Begrijpen en verstaan doen we dagelijks ontelbare keren zonder daar 
verder bij stil te staan. Het grootste deel van de tijd gaat dit 
goed. En dat terwijl er zoveel mis kan gaan. Deze tentoonstelling 
maakt u hiervan bewust en zet uw hersenen keer op keer voor het 
blok. U kunt onder meer ervaren dat computers en kinderen (nog) niet 
zulke goede verstaanders zijn. In Groningen heeft drs. Gerlof Bouma 
een computerprogramma ontwikkeld dat ondanks een gebrek aan 
wereldkennis toch in veel gevallen de juiste betekenis van woorden 
als 'hij' en 'zij' kan bepalen. De computer maakt daarvoor gebruik 
van regels, die met elkaar in conflict kunnen zijn. De computer 
zoekt dan naar de 'beste' of 'optimale' betekenis. U kunt dit 
computerprogramma aan het werk zetten op de tentoonstelling. Bedenk 
zelf een stukje tekst en test het taalbegrip van de computer. 

Zie: http://www.let.rug.nl/~hendriks/tentoon/. 

-------------------------------------------------------------------- 

6. Interview met Markus Egg over computationeel discourse-onderzoek
*******************************************************************

In de serie "Interviews met CLCGers over Taalkunde" van John 
Nerbonne is sinds kort ook een vraaggesprek met universitair 
hoofddocent en discourse-onderzoeker Markus Egg beschikbaar.

"De vooruitgang in de computationele lingu�stiek en de 
taaltechnologie die door syntactisch geannoteerde corpora is 
geboekt, is zo enorm dat hij grootschalige projecten voor de 
annotatie van corpora ook met discourse-structuur heeft 
gestimuleerd. Onze bijdrage aan deze taak is de ontwikkeling van 
semi-automatische analysemethoden voor discourse-structuur op basis 
van syntactische structuren. Zo kunnen grote hoeveelheden tekst met 
een hoge inter-rater-reliability annoteerd worden. Ik verwacht dat 
zulke corpora een belangrijke bijdrage kunnen bieden aan discourse-
onderzoek, bijv. de samenhang tussen discourse-structuur en cohesie-
middelen zoals anaforen en lexicalische relaties of verdere inzicht 
in genre-afhankelijke structuurverschillen."

Zie: http://www.let.rug.nl/nerbonne/misc/clcg-interviews/.

-------------------------------------------------------------------- 

7. WNT gratis op internet raadpleegbaar
***************************************

Sinds eind januari is het Woordenboek der Nederlandsche Taal (WNT) 
gratis op het internet raadpleegbaar. Het WNT bevat honderdduizenden 
verklaringen van Nederlandse woorden en een veelvoud daarvan aan 
aanhalingen uit bronnen uit de periode tussen ongeveer 1500 en 1976. 
Alle trefwoorden kunnen worden opgevraagd in hun originele spelling 
uit 1863, maar ook in de moderne spelling. Daarnaast is het onder 
andere mogelijk te zoeken naar delen van woorden (bijv. 
achtervoegsels, voorvoegsels), naar woordcategorie�n (bijv. 
tussenwerpsels, voegwoorden) of naar termen die in 
betekenisverklaringen gebruikt zijn (bijv. alle woorden die de term 
plant of schip in de betekenisverklaring hebben).

In het WNT online zijn ook koppelingen aangebracht naar informatie 
buiten het woordenboek. Zo zijn bijvoorbeeld alle woorden uit de tot 
nu toe verschenen delen van  het Etymologisch Woordenboek van het 
Nederlands, met de recentste ontwikkelingen op etymologisch gebied, 
gekoppeld aan hun equivalent in het WNT. Verder zijn er koppelingen 
naar overeenkomstige woorden in het Afrikaans, afbeeldingen van 
planten en dieren en dialectkaarten.

Het raadplegen van het WNT online is gratis en gemakkelijk. Na een 
eenmalige registratie als gebruiker van dit product kan men het 
woordenboek raadplegen waar en wanneer men maar wil. Voor 
instellingen is het nog eenvoudiger om het WNT online te raadplegen, 
want deze hebben vrij toegang tot dit product op basis van hun IP-
adres.

Deze onlineversie van het Woordenboek der Nederlandsche Taal is het 
eerste onderdeel van het project 'Historische woordenboeken van het 
Nederlands online' van de afdeling Taalbank van het Instituut voor 
Nederlandse Lexicologie. Het WNT online wordt via de Nederlandse 
Taalunie gefinancieerd door het Ministerie van OCW en het Ministerie 
van de Vlaamse Gemeenschap.

Zie: http://wnt.inl.nl/.

-------------------------------------------------------------------- 

8. Acapela en Assistiveware lanceren TextParrot
***********************************************

Acapela and AssistiveWare have launched TextParrot, the first 
product of the new "ConvenienceWare" family, a set of products 
designed to make advanced technologies available in convenient 
applications for Mac users. TextParrot 1.0 is a multilingual speech 
solution for Mac OS X that allows users to listen to documents with 
Acapela's natural sounding voices. Using Acapela text to speech, 
TextParrot literally converts any written text into speech, capable 
of transforming any type of information in real-time.

TextParrot includes voices in US English, UK English, French, 
German, Italian, Danish, Dutch, Flemish, Spanish, Portuguese, 
Norwegian and Swedish. Note that these special ConvenienceWare 
voices will not work in other applications.

Zie: http://www.acapela-group.com/, http://www.assistiveware.com/.

-------------------------------------------------------------------- 

9. Oproep voor bijdragen over zangsynthese
******************************************

SYNTHESIS OF SINGING CHALLENGE, Special Session at INTERSPEECH 2007
 
Singing is perhaps the most expressive usage of human voice and 
speech. An excellent singer, whether in classical opera, musical, 
pop, folk music, or any other style, can express a message and 
emotion so intensely that it moves and delights a wide audience. 
Synthesizing singing may be considered therefore as the ultimate 
challenge to our understanding and modeling of human voice. In this 
two hours interactive special session of INTERSPEECH 2007 on 
synthesized singing, we hope to present an enjoyable demonstration 
of the current state of the art, and we challenge you to contribute!
 
The session will be special in many ways:
* Participants have to submit a composition of their own choice, and 
they have to produce their own version of a compulsory musical 
score.
* During the special session, each participant will demonstrate the 
free and compulsory composition, with additional explanation.
* The contribution will be commented by a panel consisting of 
synthesis experts and singers, and the audience.
* Evaluative statements will be voted for by everyone, if possible 
by a voting box system.
* The most preferred system will be allowed to play the 
demonstration during the closing session of the conference.
 
If you are interested to join the challenge, you are invited to 
submit a paper on your system and to include an example composition 
of your own choice (in .wav format) within the regular submission 
procedure of INTERSPEECH 2007, and to select "Synthesis of Singing 
Challenge" as special session. The deadline is March 23, 2007. We 
also offer a light submission procedure that will not result in a 
regular peer reviewed paper in the Proceedings. In that case you can 
submit the composition of your own choice in .wav format to the 
session organizer before April 27, 2007.
 
Zie: http://www.interspeech2007.org/.

-------------------------------------------------------------------- 

10. Vacature promovendus ACORNS-project CLST (RU Nijmegen)
*********************************************************

Acquisition of Communication and Recognition Skills (ACORNS) is a 
highly ambituous project, financed by the European Commission, which 
aims to develop a computer simulation of the way in which young 
children acquire their native language. For this project we are 
looking for a PhD candidate who will be based at the Centre for 
Language and Speech Technology at the Radboud University Nijmegen. 
The task of the PhD student will be to develop an autonomous 
language acquisition system by integrating software modules that are 
built by other partners of the project consortium. Further s/he will 
conduct experiments with the system in order to evoke adequate 
reactions from the system to audio-visual input. On the basis of the 
feedback to the reactions, the system should learn to recognise 
words and their meanings in speech signals.

The PhD student will have the opportunity to conduct part of the 
research in the lab of one of the ACORN Consortium members in 
Belgium, Great Brittain, Sweden, Finland, or the USA.

A successful candidate must have a strong background in informatics, 
cognitive sciences, AI, and preferably signal processing and pattern 
recognition. Due to the international context of the project, 
excellent coomunication skills in English are essential, as well as 
a good record of collaboration in teams. Candidates must be already 
authorized to work in the EU.

Duration of contract: 3.5 years.

Closing date: 18 February 2007 

Zie: http://www.ru.nl/clst/

-------------------------------------------------------------------- 

11. Vacatures computerlinguist en student-assistenten (K.U. Leuven)
*******************************************************************

Het Centrum voor Computerlinguistiek van de K.U.Leuven heeft
vacatures voor (1) een computerlinguist (voltijds, junior) en
(2) student-assistenten (deeltijds).

Zie: http://www.ccl.kuleuven.be/vacature.php

-------------------------------------------------------------------- 
© Nederlandse Taalunie, 2000-2012 alle rechten voorbehouden
WegwijzerColofonContactVrijwaringOpmerkingen en reacties