taalunieversum

Direct naar menu
U bent hier: start » taal » technologie »

taal- en spraaktechnologienieuws apr'2011

Taal- en spraaktechnologienieuws april 2011
**********************************************************************
0. TST op de agenda
1. Symposium 'De automatische taalhulp' (31 mei 2011, Tilburg)
2. In 2012 eerste Europese auto met spraakgestuurd SYNC-systeem
3. Sluiting netwerksubsidies STEVIN-programma
4. Nieuw op Kennislink: T9-verwarring
5. Twee vacatures Departement Elektrotechniek (KU Leuven)

Heeft u ook een nieuwsbericht of een aankondiging, dan vernemen wij
dat graag (sluitingsdatum volgend nummer: 16/06/2011). Deze en
voorgaande edities van Taal- en spraaktechnologienieuws zijn online
beschikbaar op http://taalunieversum.org/tst/nieuwsbrief/.

======================================================================
U ontvangt dit bericht omdat uw gegevens zijn opgenomen in de taal- en
spraaktechnologiedatabank van de Nederlandse Taalunie (
http://taalunieversum.org/tst/). Wijzigingen voor deze databank kunt u
melden via tst@taalunie.org - dank u wel!
======================================================================

----------------------------------------------------------------------
0. TST op de agenda
**********************************************************************
- International Conference on Web Information Systems and Technologies
(WEBIST)
(06/05 tot 09/05 in Noordwijkerhout)
- Colloquium Taal en Spraak over de geschiedenis van TST
(11/05 in Nijmegen)
- Benelearn 2011: Belgisch-Nederlandse conferentie over machine
learning
(20/05 in Den Haag)
- EAMT 2011
(30/05 tot 31/05 in Leuven)
- Symposium 'De automatische taalhulp'
(31/05 in Tilburg)
- TABU Dag 2011
(17/06 tot 18/06 in Groningen)

----------------------------------------------------------------------
1. Symposium 'De automatische taalhulp' (31 mei 2011, Tilburg)
**********************************************************************
Hoe kan de computer ons helpen bij het schrijven? Wat is de stand van
zaken op het gebied van spellingcontrole? Wat weet de computer van
grammatica en stijl? Kan de computer de leesbaarheid van een tekst
bepalen? Wat is er zo moeilijk aan het opsporen en corrigeren van
taalfouten, zowel voor mensen als voor machines? In het symposium 'De
automatische taalhulp' worden nieuwe innovatieve producten en studies
op het gebied van spellingcorrectie en schrijfondersteuning
gepresenteerd en gedemonstreerd. Het symposium heeft een Vlaams-
Nederlands karakter en wordt georganiseerd door het Tilburg center for
Cognition and Communication in samenwerking met de Nederlandse
Taalunie.

Naast onder meer lezingen van Ted Sanders (Universiteit Utrecht) en
Gerard Kempen (Universiteit Leiden en Max Planck Institute for
Psycholinguistics, Nijmegen) zijn er ook demonstraties van producten
voor tekstcorrectie en schrijfondersteuning. Op een demonstratiemarkt
wordt de gelegenheid geboden om de producten uit te proberen en met de
ontwikkelaars van gedachten te wisselen. Er worden onder andere
demonstraties gegeven door OpenTaal, Gridline, het INL, Sensotec, LT3,
en Joyrite.

Het dagvullende symposium is kosteloos en open voor iedereen die
interesse heeft in automatische hulpmiddelen voor tekstcorrectie. Wel
dient u zich vooraf online aan te melden.

Zie ook:
http://www.tilburguniversity.edu/de_automatische_taalhulp

----------------------------------------------------------------------
2. In 2012 eerste Europese auto met spraakgestuurd SYNC-systeem
**********************************************************************
In 2012 wordt de nieuwe Ford Focus als eerste Europese auto voorzien
van SYNC-technologie. SYNC is een spraakgestuurd connectiviteits- en
infotainmentsysteem dat naar verwachting tegen 2015 in 2 miljoen
auto's gebruikt zal worden. Door het invoeren van spraaktechnologie
willen autoconstructeurs bereiken dat bestuurders tijdens het rijden
minder worden afgeleid door het bedienen van knoppen of schermen. De
SYNC-technologie kan 10.000 opdrachten herkennen in 19 verschillende
talen, waaronder het Nederlands.

Zie:
http://knack.rnews.be/nl/actualiteit/belga-algemeen/ford-focus-kan-
vanaf-2012-tienduizend-bevelen-uitvoeren/article-1194963611219.htm

----------------------------------------------------------------------
3. Sluiting netwerksubsidies STEVIN-programma
**********************************************************************
De mogelijkheid om binnen het STEVIN-programma netwerksubsidies aan te
vragen wordt per 1 juli 2011 gesloten. STEVIN is een meerjarig
onderzoeks- en stimuleringsprogramma voor Nederlandstalige taal- en
spraaktechnologie dat gezamenlijk door de Vlaamse en Nederlandse
overheid wordt gefinancierd. Het programma verkeert momenteel in de
afsluitende fase.

Zie: http://taalunieversum.org/taal/technologie/stevin/

----------------------------------------------------------------------
4. Nieuw op Kennislink: T9-verwarring
**********************************************************************
De T9-software op je mobieltje zorgt ervoor dat je razendsnel kunt
sms’en. Maar soms gaat het mis. Onder elk cijfer staan drie of vier
letters, dus soms weet je telefoon niet precies welk woord je bedoelt.
En dat kan voor grappige of pijnlijke verwarringen zorgen. Kennislink
schreef daarom een wedstrijd uit waarin bezoekers van de website werd
gevraagd hun leukste T9-verwarringen op te sturen. De resultaten van
deze wedstrijd zijn nu bekend.

Zie:
http://www.kennislink.nl/publicaties/de-dirty-mind-van-ons-mobieltje

----------------------------------------------------------------------
5. Twee vacatures Departement Elektrotechniek (KU Leuven)
**********************************************************************

1: Speech Recognition for under-resourced languages [Test Case: South
African languages]

Today's speech recognition systems require hundreds of hours of
example data for training the acoustic models. While such large
corpora are available for the major languages, this is not the case
for smaller languages, making them "under-resourced". One of the
underlying reasons for this data hungriness is that the dimensionality
of feature vectors used in state-of-the-art speech recognition systems
(typically in the range 30-40) is much larger than the intrinsic
dimensionality of speech which is estimated to be 7-10 only. Efforts
to make the intrinsic dimensionality smaller have been largely futile
as the constraints are too complex for our by and large linear
techniques. This inefficiency in basic representation, combined with
other inefficiencies in mainstream context-dependent modeling makes
that the hundreds of thousands parameters that constitute an acoustic
model are largely redundant.

The objective of this project is to apply novel mathematical
techniques (e.g. spectral clustering) that can capture constraints -
not in the feature space - but in the model space, i.e. in the
underlying HMM parameters. Such constraints will lead to lesser
requirements on the size of the training databases and should increase
robustness in all situations where we don't have large corpora
available, such as speaker adaptation, accent adaptation or modeling
of under-resourced languages. Apart from general principles, two test
cases will be be studied in more detail : i) "Afrikaans", for which
data from Dutch and Flemish can be reused; ii) languages form the
Bantu family as spoken in South Africa for which we can only bootstrap
from a wide set of rather unrelated languages.

This project will be run in collaboration with Council for Scientific
and Industrial Research (CSIR), Pretoria, South Africa.

Candidates ideally have a university degree in engineering, computer
science or applied mathematics. Skills and experience in any of the
following areas are welcomed:
- strong mathematical background (linear algebra, statistics, pattern
recognition)
- speech recognition and speech modeling
- some familiarity with Dutch or Afrikaans is a help, though not
strictly required
- computational skills (MATLAB, C, UNIX, Python)

We will both consider candidates for a Ph.D. position (4yr position)
as junior post-docs (2yr position)


2: The learning speech interface

A funded PhD position is vacant at the Centre for Processing of Speech
and Images of K.U.Leuven, Belgium in the context of the ALADIN project
(http://www.esat.kuleuven.be/psi/spraak/projects/?proj=ALADIN).
The aim of ALADIN is to build a learning and adapting vocal human-
machine interface for controlling home appliances, games and personal
assistants for users with a physical impairment. The interface should
learn what the vocal characteristics of the user are, which words
he/she uses and what he/she means with the spoken commands. Users can
formulate commands in any way they like, using the words they like and
only addressing the functionality they are interested in. Learning
takes place by using the device, i.e., by mining the vocal commands
and the change they provoke in the device.
You will design adaptive learning strategies for acquiring and
maintaining the user's vocabulary and their association to machine
actions. To this end, you will refine modern machine learning
techniques such as sparse coding, non-negative matrix factorization
and spectral clustering. You will work in a multidisciplinary team of
junior and senior researchers in machine learning, speech processing,
signal processing, user interface design and interest groups for
physically impaired users.

Qualifications
Candidates should ideally have a Master or equivalent degree in
engineering or computer science. Candidates with a math or physics
degree and excellent programming skills may apply as well. Previous
experience in speech recognition is not required but knowledge of or
experience in any the following areas form an asset:
* speech recognition and speech modelling
* programming experience in Matlab and Python
* strong mathematical and statistical background

Zie: http://phd.kuleuven.be/set/voorstellen_departement?departement=
50000516

----------------------------------------------------------------------

© Nederlandse Taalunie, 2000-2012 alle rechten voorbehouden
WegwijzerColofonContactVrijwaringOpmerkingen en reacties