taalunieversum

Direct naar menu
U bent hier: start » taal » technologie »

taal- en spraaktechnologienieuws nov'08


Taal- en spraaktechnologienieuws november 2008
**********************************************************************

0. TST op de agenda
1. Eerste STEVIN-resultaten beschikbaar bij de TST-Centrale
2. STEVIN: oproep voor master classes (sluitingsdatum 31 januari)
3. Meer Taal in Bedrijf op het online discussieforum
4. Spraaksynthese van Fluency uitkomst voor jonge spraakgehandicapten
5. Dag van de fonetiek: onderzoek naar spraak en spraaktechnologie
6. Nieuw op Kennislink: computers eerste woordjes
7. Vacature postdoc spraakherkenning (K.U.Leuven/ESAT, Leuven)

Heeft u ook een nieuwsbericht of een aankondiging, dan vernemen wij
dat graag (sluitingsdatum volgend nummer: 16/12/08). Deze
en voorgaande edities van Taal- en spraaktechnologienieuws zijn on-
line beschikbaar op http://taalunieversum.org/tst/nieuwsbrief/.

======================================================================
U ontvangt dit bericht omdat uw gegevens zijn opgenomen in de taal- en
spraaktechnologiedatabank van de Nederlandse Taalunie (
http://taalunieversum.org/tst/). Wijzigingen voor deze databank kunt u
melden via tst@taalunie.org - dank u wel!
======================================================================

----------------------------------------------------------------------
0. TST op de agenda
**********************************************************************

- Colloquium Information and Language Processing Systems (ILPS)
(28/11 in Amsterdam)
- Colloquiumaflevering UiL OTS over definitie-extractie
(11/12 in Utrecht)
- De dag van de fonetiek
(18/12 in Utrecht)

Zie: http://taalunieversum.org/tst/

----------------------------------------------------------------------
1. Eerste STEVIN-resultaten beschikbaar bij de TST-Centrale
**********************************************************************

De eerste resultaten uit het STEVIN-programma zijn vanaf heden
opgenomen in de productcatalogus van de TST-Centrale. De catalogus is
aangevuld met twee tekstcorpora, twee spraakcorpora, een
meerwoordlexicon en een transcriptietool:

* AUTONOMATA-g2p-toolkit: een transcriptietool en learningtools,
waarmee woordenlijsten verrijkt kunnen worden met nauwkeurige
fonetische transcripties (resultaat van het AUTONOMATA-project)
* AUTONOMATA-namencorpus: een spraakdatabase (Nederlands/Vlaams) van
in totaal ± 5.000 voornamen, achternamen, plaatsnamen en
controlewoorden (resultaat van het AUTONOMATA-project)
* COREA-coreferentiecorpus: Nederlandse teksten (± 500.000 woorden)
waarin coreferentierelaties systematisch gemarkeerd zijn (resultaat
van het COREA-project)
* D-Coi-corpus: een tekstverzameling hedendaags geschreven Nederlands
van ± 54 miljoen woorden (resultaat van het D-Coi-project)
* DuELME: een lexicon met ruim 5.000 Nederlandstalige
meerwoordexpressies (resultaat van het IRME-project)
* JASMIN-spraakcorpus: een verzameling van ± 95 uur spraak van
jongeren, anderstaligen en senioren, bestaande uit voorgelezen tekst
en mens-machinedialogen (resultaat van het JASMIN-CGN-project)

STEVIN is een meerjarig onderzoeks- en stimuleringsprogramma voor
Nederlandstalige taal- en spraaktechnologie dat gezamenlijk door de
Vlaamse en Nederlandse overheid wordt gefinancierd.

Zie: http://www.inl.nl/tst-centrale

----------------------------------------------------------------------
2. STEVIN: oproep voor master classes (sluitingsdatum 31 januari)
**********************************************************************

In het kader van het STEVIN-programma kunnen nu subsidies voor het
geven van master classes worden aangevraagd. De master classes zijn
bedoeld om de algemene belangstelling voor en kennis van taal- en
spraaktechnologische toepassingen en onderzoek binnen overheden en
bedrijfsleven te vergroten.

In 2008 zal er één oproep voor voorstellen voor master classes worden
geopend met een totaalbedrag van 27.500,- euro exclusief BTW. Per
master class is maximaal 10.000,- euro beschikbaar voor de
ontwikkeling van inhoudelijk cursusmateriaal en de kosten voor
(externe) sprekers. Daarnaast is maximaal 500,- euro beschikbaar per
aanwezige deelnemer met een maximum van 20 deelnemers en een minimum
van 8 deelnemers. Aanvullende financiering door de indieners van ten
minste 35% van de totale begroting is vereist.

De indiener moet gebruik maken van het aanvraagformulier voor master
classes. Het aanvraagformulier zal zo spoedig mogelijk beschikbaar
worden gesteld op de STEVIN-pagina's van het Taalunieversum. Het
volledig ingevulde aanvraagformulier moet elektronisch worden
ingediend bij het programmabureau van STEVIN
(m.nuijten@senternovem.nl). Indienen kan vanaf 1 december 2008 tot 31
januari 2009.

Zie: http://www.taalunieversum.org/STEVIN

----------------------------------------------------------------------
3. Meer Taal in Bedrijf op het online discussieforum
**********************************************************************

Bijna 200 deelnemers van ongeveer 140 verschillende organisaties uit
Nederland en Vlaanderen namen deel aan een geslaagde tweede editie van
Taal in Bedrijf. Het evenement vond op woensdag 19 november plaats in
hotel Husa President Park in Brussel en werd georganiseerd door het
departement Economie, Wetenschap en Innovatie van de Vlaamse overheid
(EWI) en de Nederlandse Taalunie.

Ook na Taal in Bedrijf kunt u mee blijven denken over de vraag hoe een
vervolg op het STEVIN-programma eruit zou moeten zien. Het
basisonderzoek naar taal- en spraaktechnologie behoeft nog
aanvullingen. Maar in een vervolg op STEVIN zou de focus vooral
gericht moeten zijn op het daadwerkelijke gebruik van
basisvoorzieningen. Vraagsturing door de industrie zou daarbij een
belangrijk uitgangspunt moeten zijn. Ook moet nagegaan worden hoe we
meer studenten enthousiast kunnen maken voor een opleiding in de taal-
en spraaktechnologie. Over al deze zaken en nog veel meer kunt u met
anderen van gedachten wisselen op het online discussieforum.

Zie: http://www.taalinbedrijf.org/forum

----------------------------------------------------------------------
4. Spraaksynthese van Fluency uitkomst voor jonge spraakgehandicapten
**********************************************************************

Met de nieuwe tekst-naar-spraaksoftware van Fluency kan men kiezen uit
zeven stemmen, waaronder ook twee tienerstemmen: een jongen van 13 en
een meisje van 16 jaar. De software om de stem van een spreker mee op
te nemen is gratis beschikbaar. De spreker moet een reeks woorden en
zinnen nazeggen en de opnamen (ongeveer 45 minuten spraak) kunnen
door Fluency worden omgezet in een spraakdatabase voor de software. De
nieuwe stemmen zijn een uitkomst voor met name jonge
spraakgehandicapten, die zich vaak verstaanbaar moeten maken met een
synthetische stem die totaal niet bij ze past. Maar ook voor andere
gebruikers en toepassingen van spraaksynthese is een ruime keuze aan
stemmen aantrekkelijk.

De nieuwe spraaksynthese wordt geleverd in nieuwe versies van Spika en
Fluency TTS. Spika is een hulpmiddel voor dyslectici, dat geheel
draait vanaf een usb-stick. Fluency TTS is een softwarepakket voor een
bredere doelgroep en kan nu ook als netwerkversie toegepast worden.

Zie: http://www.fluency.nl

----------------------------------------------------------------------
5. Dag van de fonetiek: onderzoek naar spraak en spraaktechnologie
**********************************************************************

De Nederlandse Vereniging voor Fonetische Wetenschappen organiseert op
donderdag 18 december weer de dag van de fonetiek. Het thema is dit
maal onderzoek naar spraak en spraaktechnologie. Het programma en de
abstracts behorend bij de lezingen zijn inmiddels te vinden op de
website. De dag van de fonetiek vindt plaats in de Sweelinckzaal,
Drift 21 te Utrecht. Deelname is gratis.

Zie: http://www.fon.hum.uva.nl/FonetischeVereniging

----------------------------------------------------------------------
6. Nieuw op Kennislink: computers eerste woordjes
**********************************************************************

Een bed is iets heel anders dan een bad, maar is bijna synoniem met
het woord "ledikant". Voor een zoekprogramma als Google en
vragendiensten als Al@din is het van levensbelang dat ze deze relaties
herkennen. Promovenda Lonneke van der Plas van de Rijksuniversiteit
Groningen ontwikkelde een systeem waarmee computers automatisch de
relaties tussen woorden kunnen leren. Het resultaat van haar onderzoek
vatte zij samen op een interactieve website.

Zie: http://www.kennislink.nl/web/show?id=213450

Voor meer TST op Kennislink, zie ondermeer:
- Spraakherkenner werkt bij ruis:
http://www.kennislink.nl/web/show?id=216760
- Focus op spraaktechnologie:
http://www.kennislink.nl/web/show?id=216416

----------------------------------------------------------------------
7. Vacature postdoc spraakherkenning (K.U.Leuven/ESAT, Leuven)
**********************************************************************

As partner in the EU Marie Curie Research Training Network Sound to
Sense we have an open position for a senior researcher. The candidate
will work on improving our hybrid based speech recognition system
combining HMM and template based recognition, more in particular
investigating pros and cons of bottom-up and top-down methods. The
further developments of the system will, among other things, be based
on suggestions provided by companion projects within the network
refining models of human speech recognition. Furthermore there will be
strong interaction with the FWO funded project TELEX.

Qualifications:
Candidates ideally have a PhD degree in engineering or computer
science. Candidates with a general science degree and excellent
programming skills may apply as well. Candidates should comply to the
candidacy rules set forward by the EU Marie Curie Research training
networks, i.e.:
- You must qualify as an EXPERIENCED researcher; i.e. you should hold
a PhD and/or have 4-10 years of research experience.
- You should be transferring to Belgium from another country: i.e. you
should not have stayed/worked in Belgium more than 12 of the last 36
months prior to the start of the job.

Knowledge of or experience in the following areas form an asset:
- speech recognition and speech modeling
- programming skills in C/C++; Python; MATLAB
- statistical parameter estimation

Term of the project
16 months starting around 01 April 2009 (exact time is somewhat
flexible). The position remains open till a suitable candidate has
been found.

Applications
Interested applicants should send their CV to Prof. Dirk Van
Compernolle and to Naomi Hilton, the S2S administrator:
dirk.vancompernolle@esat.kuleuven.be & soundsen@hermes.cam.ac.uk

Zie:
http://www.esat.kuleuven.be/psi/spraak/projects/?proj=SOUND_to_SENSE

© Nederlandse Taalunie, 2000-2009 alle rechten voorbehouden
WegwijzerColofonContactVrijwaringOpmerkingen en reacties