Taal- en spraaktechnologienieuws mei 2008
**********************************************************************
0. TST op de agenda
1. Alvast noteren: Taal in Bedrijf 2008
2. Politie Utrecht blij met Kentekenlijn
3. Nieuwe website voor stichting NOTaS
4. Online vertalen van en naar het Nederlands
5. Nuance hoofdsponsor Frederik Muller Congres
6. Vacature Parse and Corpus based Machine Translation (CCL, Leuven)
7. Vacature spraakdialoogsystemen (Nuance, Merelbeke)
8. Diverse vacatures taaltechnologie (Textkernel, Amsterdam)
9. Twee vacatures promotieplaatsen taaltechnologie (RUG, Groningen)
Heeft u ook een nieuwsbericht of een aankondiging, dan vernemen wij
dat graag (sluitingsdatum volgend nummer: 15/06/08). Deze en
voorgaande edities van Taal- en spraaktechnologienieuws zijn on-line
beschikbaar op http://taalunieversum.org/tst/nieuwsbrief/.
======================================================================
U ontvangt dit bericht omdat uw gegevens zijn opgenomen in de taal- en
spraaktechnologiedatabank van de Nederlandse Taalunie (
http://taalunieversum.org/tst/). Wijzigingen voor deze databank kunt u
melden via tst@taalunie.org - dank u wel!
======================================================================
----------------------------------------------------------------------
0. TST op de agenda
**********************************************************************
- Conferentie over nieuwe benaderingen in de tekstlingu�stiek
(22/05 tot 24/05 in Brussel)
- Automatische emotieherkenning in spraak
(23/05 in Soesterberg)
- ILPS-seminar: Local alignment kernel in the context of NLP
(23/05 in Amsterdam)
- KansRijk 2008
(05/06 in Nieuwegein)
- Workshop semantische technologie�n voor systeemonderhoud
(09/06 in Amsterdam)
- Bijeenkomsten STEVIN en IMIX
(25/06 tot 27/06 in Rotterdam)
Zie: http://taalunieversum.org/tst/
----------------------------------------------------------------------
1. Alvast noteren: Taal in Bedrijf 2008
**********************************************************************
Taal in Bedrijf is h�t Vlaams-Nederlandse evenement op het gebied van
taal- en spraaktechnologie. Taal in Bedrijf 2008 vindt plaats op
19/11/2008 in Brussel (hotel Husa President Park). Noteert u deze
datum alvast in uw agenda. Het programma volgt nog.
Zie: http://taalunieversum.org/taal/technologie/stevin/evenementen/
----------------------------------------------------------------------
2. Politie Utrecht blij met Kentekenlijn
**********************************************************************
Agenten van de regio Utrecht zijn enthousiast over de Kentekenlijn:
een applicatie die het mogelijk maakt om voertuig- en
eigenaarinformatie op te vragen. De agent (in de auto, lopend, op de
fiets, te paard) belt de Kentekenlijn, spreekt een kenteken in en de
computer leest alle benodigde informatie voor. Dit ontlast de 112-
meldkamer en maakt het mogelijk dat agenten laagdrempeliger informatie
kunnen opvragen. Spraakherkenning wordt ingezet voor het herkennen van
kentekens en spraaksynthese voor het voorlezen van de informatie. De
Kentekenlijn is ontwikkeld door Dutchear, in nauwe samenwerking met de
VTSPN, de Politie Utrecht en STEVIN. STEVIN is een meerjarig
onderzoeks- en stimuleringsprogramma voor Nederlandstalige taal- en
spraaktechnologie dat gezamenlijk door de Vlaamse en Nederlandse
overheid wordt gefinancierd.
Zie: http://www.dutchear.nl/
----------------------------------------------------------------------
3. Nieuwe website voor stichting NOTaS
**********************************************************************
De nieuwe website van de stichting NOTaS is online sinds begin mei
2008 en wordt gehost door NOTaS-deelnemer GridLine. Naast de
vertrouwde informatie van en over NOTaS kunnen deelnemers op de nieuwe
website hun organisaties (kort) zelf presenteren. Ook kunnen de NOTaS-
deelnemers zelf vacatures, nieuws- en persberichten toevoegen.
Zie: http://notas.gridhopper.nl/
----------------------------------------------------------------------
4. Online vertalen van en naar het Nederlands
**********************************************************************
Met Google Vertaling kan online vertaald worden tussen 23 talen,
waaronder het Nederlands. Tot voor kort was het vanuit talen als het
Nederlands, Japans en Fins alleen mogelijk om automatisch te vertalen
van en naar het Engels. Nu is het ook voor deze talen mogelijk
onderling te vertalen, dus direct van het Nederlands naar elk van
de andere 22 talen.
Zie: http://translate.google.com/
----------------------------------------------------------------------
5. Nuance hoofdsponsor Frederik Muller Congres
**********************************************************************
Nuance Communications, Inc. neemt deel aan de 43ste editie van het
Frederik Muller Congres dat plaatsvindt in het MIM, het instituut voor
Media & Informatie Management in Amsterdam, op 29 mei 2008. Het media-
evenement, met de naam "Press Play, for the future of mobile
publishing", wil de congresbezoeker in contact brengen met de huidige
en toekomstige multimediale toepassingen. Onderwerpen als E-books,
toekomstperspectieven voor mobiele applicaties, streaming video,
privacy en auteursrecht komen uitgebreid aan bod. Nuance zal op het
media-evenement spraakoplossingen tonen voor mobiele applicaties en
een workshop organiseren over Dragon NaturallySpeaking.
Zie: http://netherlands.nuance.com/
----------------------------------------------------------------------
6. Vacature Parse and Corpus based Machine Translation (CCL, Leuven)
**********************************************************************
In het kader van het binnen STEVIN gefinancierde project PaCo-MT
(Parse and Corpus based Machine Translation) biedt het Centrum voor
Computerlingu�stiek een baan aan voor een computerlingu�st. Het
project loopt van 1 februari 2008 tot en met 31 januari 2011 en wordt
geco�rdineerd door het Centrum voor Computerlingu�stiek. De andere
partners zijn de Rijksuniversiteit Groningen en het vertaalbedrijf
OneLiner bvba. STEVIN is een meerjarig onderzoeks- en
stimuleringsprogramma voor Nederlandstalige taal- en spraaktechnologie
dat gezamenlijk door de Vlaamse en Nederlandse overheid wordt
gefinancierd.
Zie: http://www.ccl.kuleuven.be/vacature.php
----------------------------------------------------------------------
7. Vacature spraakdialoogsystemen (Nuance, Merelbeke)
**********************************************************************
In order to strengthen our Embedded ASR Research team, we are looking
for a:
RESEARCH ENGINEER SPEECH DIALOGUE SYSTEMS
As part of our team, you will be creating speech technologies for
embedded applications varying from simple command and control tasks up
to natural language speech dialogues on mobile and automotive
platforms.
OVERVIEW:
- You will work in Nuance's Embedded ASR research and production team,
creating technology, tools and runtime software to enable our
customers develop embedded speech applications. In our team of speech
and language experts, you will work on natural language dialogue
systems that define the state of the art.
- You will work at Nuance's International Headquarters in Merelbeke, a
small town just 5km away from the heart of the picturesque city of
Ghent, in the Flanders region of Belgium. Ghent has one of the most
spectacular historic town centers of Europe and is known for its
unique vibrant yet cozy charm, and is home to a large international
university.
- You will work in an international company and cooperate with people
on various locations including in Europe, America, and Asia. You may
occasionally be asked to travel.
RESPONSIBILITIES:
- You will work on the development of cutting edge natural language
dialogue and speech recognition technologies for automotive embedded
systems and mobile devices.
- You will design, implement, evaluate, optimize, and test new
algorithms and tools for our speech recognition systems, both for
research prototypes and deployed products, including all aspects of
dialogue systems design, such as architecture, natural language
understanding, dialogue modeling, statistical framework, and so forth.
- You will help the engine process multi-lingual natural and
spontaneous speech in various noise conditions, given the challenging
memory and processing power constraints of the embedded world.
Zie: http://netherlands.nuance.com/
----------------------------------------------------------------------
8. Diverse vacatures taaltechnologie (Textkernel, Amsterdam)
**********************************************************************
Work on machine learning and language technology at Textkernel
Textkernel is developing cutting edge machine learning based document
understanding solutions for a fast growing number of international
clients. We are looking for passionate and expert colleagues, who
combine a deep interest in advanced computing and software engineering
with the ambition to deliver outstanding products and services.
We are currently looking for:
* Language technology consultants
* Computational linguists
* Knowledge engineers
* Web mining engineers
with excellent programming skills (Perl, Java, C/C++) and an ambitious
and creative personality. Academic background in computer science,
artificial intelligence or related field. Interest in natural language
processing, machine learning, information extraction, web mining, and
pattern recognition. Minimum of 2 years of experience in an industrial
software engineering environment. Focused on delivering high quality
services and enterprise level software.
Textkernel is based in Amsterdam, The Netherlands. Relocation is
required. Basic understanding of Dutch, and other European languages
is a plus.
If you would like to be considered for one of these positions at
Textkernel, please send your CV to vacature@textkernel.nl with
"Textkernel vacature / [ jobtitle ]" in the subject field.
Zie: http://www.textkernel.nl/
----------------------------------------------------------------------
9. Twee vacatures promotieplaatsen taaltechnologie (RUG, Groningen)
**********************************************************************
The University of Groningen, Faculty of Arts, Center for Language and
Cognition, announces the following two PhD positions:
1. PhD position in Parse and Corpus based Machine Translation (PaCO-
MT) (1,0 fte)
The STEVIN PaCo-MT project aims at developing an open domain hybrid MT
system integrating proper linguistic analysis and syntactic transfer
into a data-driven approach to be used by professional translators.
Translation will be based on transfer (lexical and syntactic) from a
parsed source language sentence into a corresponding target language
structure. From this the final output is generated using information
from a large target language Treebank that will ensure grammaticality
and fluency. The MT application will be developed for the language
pairs Dutch<>English and Dutch<>French. A post editing interface will
be provided to adapt the output to user needs. The Flemish-Dutch
consortium consists of two academic partners (Leuven and Groningen
University) and one industrial partner (Oneliner Language and Business
Solutions). The PhD project within PaCo-MT in Groningen will be
focused on building bilingual resources necessary for our translation
approach. In particular, we will create resources such as translation
dictionaries, translation memories and structure mapping rules. We
will emphasize the use of syntactic annotation (in both, source and
target language) in the automatic extraction of bilingual lexical data
and transfer rules. Programming skills are required and knowledge
about SMT and alignment techniques are definitely a plus.
2. PhD position in Dutch Language Investigation of Summarization
Technology (DAISY) (1,0 fte)
The aim of STEVIN DAISY is to develop and evaluate essential
technology for automatic summarization of Dutch informative texts.
Innovative algorithms for topic salience detection, topic
discrimination, rhetorical classification of content, sentence
compression and text generation will be implemented. An important part
of the DAISY project concerns sentence generation. The task of the
sentence generation module is to produce actual grammatical sentences
on the basis of such abstract representations, using the declarative
grammar of Alpino as its key knowledge source. Alpino is a wide-
coverage grammar for Dutch, defined as a unification-based grammar, in
which many insights from HPSG have been implemented (examples are the
inheritance hierarchy of lexical types and grammatical rules). There
has been a lot of work on text generation for unification grammars.
More recent work on which we will base our approach includes Carroll
and Oepen (2005). Although the Alpino grammar can be used to ensure
that well-formed sentences are produced, a further fluency module will
be developed to ensure that the sentences that are produced are
natural and appropriate. Just as parsing needs a (statistical)
disambiguation component to select the appropriate parse from
potentially large sets of possible parses, we need a fluency component
to select the most appropriate sentence from the set of possible
sentences given by the grammar. For the fluency component, we propose
to develop a machine-learning method similar in approach to the
disambiguation component of the Alpino parser. The disambiguation
component of Alpino contains a discriminative maximum-entropy model,
trained on the Alpino treebank. For statistical ranking of competing
surface realizations of the same content, we propose to implement a
similar discriminative maximum-entropy model.
Zie: http://www.rug.nl/let/onderzoek/onderzoekinstituten/clcg/index
----------------------------------------------------------------------
©
Nederlandse Taalunie, 2000-2009 alle rechten voorbehouden
Wegwijzer – Colofon – Contact – Vrijwaring – Opmerkingen en reacties
Wegwijzer – Colofon – Contact – Vrijwaring – Opmerkingen en reacties
