Taal- en spraaktechnologienieuws maart 2007
*******************************************
0. TST op de agenda
1. STEVIN: derde open oproep (sluitingsdatum 22/5)
2. Europees project verbetert toegankelijkheid educatieve content
3. KPN en Autonomy ontwikkelen VoiceRouting
4. Twee taaltechnologen in het bedrijfsleven aan het woord
5. Speciale sessies bij Interspeech'07 (augustus, Antwerpen)
6. Vacature onderzoeker tekst mining (KU Leuven)
7. Vacature junior onderzoeker spraakherkenning (KU Leuven)
Heeft u ook een nieuwsbericht of een aankondiging, dan vernemen wij
dat graag (sluitingsdatum volgend nummer: 4/4/7). Deze en voor-
gaande edities van Taal- en spraaktechnologienieuws zijn on-line
beschikbaar op
http://taalunieversum.org/taal/technologie/nieuwsbrief/.
====================================================================
U ontvangt dit bericht omdat uw gegevens zijn opgenomen in de taal-
en spraaktechnologiedatabank van de Nederlandse Taalunie
(www.taalunieversum.org/tst). Wijzigingen voor deze databank kunt u
melden via tst@taalunie.org - dank u wel!
====================================================================
--------------------------------------------------------------------
0. TST op de agenda
*******************
Studiedag Compenserende hulpmiddelen
12/03/2007 in Antwerpen
Nederlands-Belgische workshop Information Retrieval (DIR2007)
28/03/2007 tot 29/03/2007 in Leuven
Colloquium Taal en Spraak: TST voor kleine talen
04/04/2007 in Nijmegen
Europese Top Tekstanalyse
26/04/2007 tot 27/04/2007 in Amsterdam
Symposium Virtuele communicatieondersteuning
28/04/2007 in Leuven
Colloquium Taal en Spraak: biometriek
09/05/2007 in Nijmegen
Belgisch-Nederlandse conferentie Machine Learning (Benelearn07)
14/05/2007 tot 15/05/2007 in Amsterdam
Zie: http://www.taalunieversum.org/tst/
--------------------------------------------------------------------
1. STEVIN: derde open oproep (sluitingsdatum 22/5)
**************************************************
STEVIN (Spraak- en Taaltechnologische Essentiële Voorzieningen In
het Nederlands) is een meerjarig onderzoeks- en stimulerings-
programma voor Nederlandstalige taal- en spraaktechnologie dat
gezamenlijk door de Vlaamse en Nederlandse overheid wordt
gefinancierd. Het programma is van start gegaan in 2004 en loopt nog
tot eind 2010.
Per 12 maart 2007 is de derde (en laatste) open oproep voor
onderzoeks- en ontwikkelingsvoorstellen opengesteld. Deze oproep
gebeurt in een enkele fase: indiening van volledige voorstellen,
externe beoordeling en prioritering door het International
Assessment Panel, beoordeling en prioritering door de
Programmacommissie, en honoreringsbesluit door het TST-bestuur. De
sluitingsdatum voor het indienen van voorstellen is vastgesteld op
22 mei 2007. Het maximale budget voor deze oproep is vastgesteld op
2,3 miljoen euro. Volledige voorstellen met een maximum duur van
drie jaar kunnen worden ingediend. Alle specifieke details zijn
beschikbaar op de website.
Tijdspad:
- eindindiendatum: 22 mei 2007 om 12u
- beoordeling internationale experten: juni 2007
- weerwoord aanvragers: laatste week juni 2007
- beoordeling programmacommissie: juli 2007
- besluit TST-bestuur: juli 2007
- effectieve start: september 2007
Zie: http://www.stevin-tst.org/projectoproepen/.
--------------------------------------------------------------------
2. Europees project verbetert toegankelijkheid educatieve content
*****************************************************************
Het verbeteren van de toegankelijkheid van de educatieve content die
gebruikt wordt binnen e-Learning systemen; dat is een van de
hoofddoelen van het project Pro Access. Het project borduurt voort
op de bevindingen en ervaringen die zijn opgedaan binnen twee andere
projecten namelijk ORMEE (http://www.ormee.net) en EUAIN. Dedicon is
de projectcoördinator van EUAIN. (http://www.euain.org). De
ervaringen en de kennis die zijn opgedaan in bovengenoemde projecten
worden geëvalueerd. Er wordt bezien hoe ze in de praktijk door
uitgevers kunnen worden toegepast en in het productieproces kunnen
worden geïmplementeerd.
Een van de hoofddoelen van Pro Access is het creëren van
bewustwording in de educatieve uitgeversmarkt over nieuwe
technologieën om eenvoudig toegankelijk educatief materiaal te
maken.
Het project, door de EU gefinancierd, is gestart in januari 2007 en
zal 18 maanden duren.
Bron: Dedicon Bulletin (2e jaargang, eerste editie, februari 2007).
Zie: http://www.dedicon.nl/
--------------------------------------------------------------------
3. KPN en Autonomy ontwikkelen VoiceRouting
*******************************************
Autonomy heeft in samenwerking met KPN een innovatief
spraakanalysesysteem ontwikkeld dat de klantvriendelijkheid en
efficiency van contact centers aanzienlijk verbetert. De dienst
wordt bij KPN Newtel aangeboden onder de naam VoiceRouting en is
gebaseerd op de IntelligentIVR software van Autonomy. Met
VoiceRouting behoort het trage intoetsen van nummerreeksen voordat
de juiste agent is bereikt tot het verleden. Het routeert
binnenkomende gesprekken op basis van volledig open spraakherkenning;
de klant spreekt zijn vraag in, de computer zet het stemgeluid om in
digitale informatie en het systeem zet de beller afhankelijk van de
vraag door naar de juiste callcentermedewerker. Omdat de
callcentermedewerker meteen weet waarover wordt gebeld en het aantal
interne doorverbindingen afneemt, wordt de klant sneller en directer
te woord gestaan.
Aan de basis van het nieuwe systeem staat de software van Autonomy.
De software zet de gesproken tekst van de beller om in een
tekstbestand. Vervolgens wordt deze tekst volgens de meaning based
computing benadering geanalyseerd met de retrievalengine IDOL.
Hiermee wordt automatisch de meest geschikte bestemming van het
gesprek bepaald, gebaseerd op business rules. Het omzetten van spraak
naar tekst en het zoek- en toewijzingsproces neemt slechts één
seconde in beslag.
Zie: http://www.autonomy.com/
--------------------------------------------------------------------
4. Twee taaltechnologen in het bedrijfsleven aan het woord
**********************************************************
In de Groningse serie interviews van John Nerbonne is een gesprek
verschenen met Leonoor van de Beek en Robbert Prins, beiden
gepromoveerd in 2005 en inmiddels aan het werk in het bedrijfsleven.
Van der Beek werkt als computationeel taalkundige bij het
Amsterdamse bedrijf Q-go, Prins als programmeur bij een Gronings
multimediabedrijf.
Van de Beek: "Op iedere taalkundige heb je 5 programmeurs nodig om
de boel draaiende te krijgen en te houden. Maar dat wil niet zeggen
dat er geen rol is weggelegd voor computationeel taalkundige
technieken. Iedere zoekmethode maakt wel gebruik van enige
computationeel taalkundige kennis, al is het maar om te bepalen welke
woorden genegeerd worden (bijv. "de", "het", "op", "zijn"). Als het
domein goed is afgebakend (en dat kan ook een module van een
algemene zoekmachine zijn), dan kan je nog veel meer bereiken met
taalkundige technieken. En als de hoeveelheid data beperkt is (zoals
bij klantcommunicatiesoftware, in tegenstelling tot een
zoekmachine), dan wordt de taalkundige onderbouwing alleen maar veel
belangrijker."
Zie: http://www.let.rug.nl/nerbonne/misc/clcg-interviews/.
--------------------------------------------------------------------
5. Speciale sessies bij Interspeech'07 (augustus, Antwerpen)
************************************************************
Call for Papers two special sessions at Interspeech 2007:
Novel techniques for the NATO non-native military air traffic
controller database (nn-matc)
Following a series of special interest sessions and workshops at
Lisbon (1995), Leusden (NL, 1999) and Aalborg (2001), the NATO
research task group on speech and language technology organizes a
special session at Interspeech 2007. After having studied various
aspects of speech in noise, speech under stress, and non-native
speech, the research task group has been studying the effects of all
of these factors on various speech technologies. To this end, the
task group has collected a corpus of military Air Traffic Control
communication in Belgian air space. This speech material consists
predominantly of non-native English speech, under varying noise and
channel conditions. The NATO research task group is making this
annotated speech database available for speech researchers, who want
to develop novel algorithms for this challenging material. In order
to facilitate a common task, we have written a suggested test and
evaluation plan to guide researchers. At the special session we will
discuss research results on this common data set.
Session organizer: David van Leeuwen (david.vanleeuwen@tno.nl)
Structure-Based and Template-Based Automatic Speech Recognition -
Comparing parametric and non-parametric approaches
While hidden Markov modeling (HMM) has been the dominant technology
for acoustic modeling in automatic speech recognition today, many of
its weaknesses have also been well known and they have become the
focus of much intensive research. The purpose of this special session
is to bring together researchers who have special interest in novel
techniques that are aimed at overcoming weaknesses of HMMs for
acoustic modeling in speech recognition. In particular, we plan to
address issues related to the representation and exploitation of
long-range temporal dependency in speech feature sequences, the
incorporation of fine phonetic detail in speech recognition
algorithms and systems, comparisons of pros and cons between the
parametric and non-parametric approaches, and the computation
resource requirements for the two approaches.
Session organizers: Li Deng (deng@microsoft.com)
Helmer Strik (strik@let.ru.nl)
Zie: http://speech.tm.tno.nl/nn-matc/
http://lands.let.ru.nl/~strik/IS2007-Special_Session-STB_ASR.html
--------------------------------------------------------------------
6. Vacature onderzoeker tekst mining (KU Leuven)
************************************************
The Legal Informatics & Information Retrieval (LIIR) research group
of the Katholieke Universiteit Leuven, Belgium is looking for a
full-time researcher in the domain of text mining. The researcher
will design, implement and evaluate techniques of semi-supervised
and unsupervised machine learning for detecting term relationships
and word meanings in a Dutch text corpus. The research is done in
collaboration with the Vrije Universiteit of Amsterdam and the
Universiteit van Amsterdam.
The Legal Informatics & Information Retrieval (LIIR) research group
of the Katholieke Universiteit Leuven, Belgium strives to develop a
general framework for information processing of texts and access to
textual databases. The core of the research regards problems of
information retrieval, extraction, summarization and search focused
on the textual medium. Because the legal field offers large digital
libraries of texts, it is an important application field of the
technology developed by the LIIR group. LIIR also studies
information retrieval problems in the domains of news, business
intelligence, bioinformatics, police and intelligence services, and
electronic mail. LIIR encourages research on the interrelation
between information retrieval and other disciplines such as
computational linguistics, machine learning, data mining, automated
reasoning, multimedia processing, and information systems in general.
Send your CV and motivation letter to Marie-Francine Moens:
marie-france.moens@law.kuleuven.be
Zie: http://www.law.kuleuven.be/icri/liir/
--------------------------------------------------------------------
7. Vacature junior onderzoeker spraakherkenning (KU Leuven)
***********************************************************
TELEX: Combining Acoustic TEmplates and LEXical Modeling
For our research activities in hybrid and template based speech
recognition, we have an open position for a junior researcher
working towards the PhD degree. The candidate will work on
extensions of the template based system. Focus will be on the use of
long span units and the integration of pronunciation modeling in the
template based framework. The template based system must also be
ideally combined with a state of the art HMM recognizer. The
candidate will work in the context of the TELEX project in close
collaboration with the Computer Science Department (CW/Nines) and
the university of Gent. There will also be intense collaboration
with the Marie Curie network Sound to Sense.
Candidates ideally have a university degree in engineering or
computer science. Candidates with a general science degree and
excellent programming skills may apply as well. Knowledge of or
experience in the following areas form an asset:
.speech recognition and speech modelling
.C/C++ programming
.statistical parameter estimation
The position is open right now (March 2007), though applications
from students graduating in spring 2007 are encouraged as well.
Interested applicants should send their CV to Prof. Dirk Van
Compernolle (compi@esat.kuleuven.be).
Zie: http://www.esat.kuleuven.be/psi/spraak/projects/?proj=TELEX
--------------------------------------------------------------------
©
Nederlandse Taalunie, 2000-2008 alle rechten voorbehouden
Wegwijzer – Colofon – Contact – Vrijwaring – Opmerkingen en reacties
Wegwijzer – Colofon – Contact – Vrijwaring – Opmerkingen en reacties