Taal- en spraaktechnologienieuws april 2007 ******************************************* 0. TST op de agenda 1. Themadag TST-centrale: stages in de TST-sector (Utrecht, 23/5) 2. Nederlandse Taalunie richt terminologiesteunpunt op 3. TST-centrale lanceert update e-Lex en nieuwe product sheets 4. Snelle opmars spraakherkenning in contactcenters 5. Hotel reserveren met spraakherkenning 6. Strategische samenwerking Telisma en Dutchear 7. Website (ver)taaltechnologieteam Hogeschool Gent 8. Afstudeerstage emotionele spraaksynthese (TNO Soesterberg) 9. Training fellowships in Sound to Sense-netwerk 10. Vacature postdoc memory-based language modeling & MT (Tilburg) 11. Diverse vacatures promovendi CLCG (Groningen) 12. Vacature onderzoeksmedewerker toegep. communicatie (Antwerpen) Heeft u ook een nieuwsbericht of een aankondiging, dan vernemen wij dat graag (sluitingsdatum volgend nummer: 2/5/7). Deze en voor- gaande edities van Taal- en spraaktechnologienieuws zijn on-line beschikbaar op http://taalunieversum.org/taal/technologie/nieuwsbrief/. ==================================================================== U ontvangt dit bericht omdat uw gegevens zijn opgenomen in de taal- en spraaktechnologiedatabank van de Nederlandse Taalunie (www.taalunieversum.org/tst). Wijzigingen voor deze databank kunt u melden via tst@taalunie.org - dank u wel! ==================================================================== -------------------------------------------------------------------- 0. TST op de agenda ******************* Europese Top Tekstanalyse (26/04/2007 tot 27/04/2007 in Amsterdam) Symposium Virtuele communicatieondersteuning (28/04/2007 in Leuven) Colloquium Taal en Spraak: biometrie (09/05/2007 in Nijmegen) Belgisch-Nederlandse conferentie Machine Learning (Benelearn07) (14/05/2007 tot 15/05/2007 in Amsterdam) Stagedag voor studenten taal en spraak (23/05/2007 in Utrecht) Colloquium Taal en Spraak: leren (06/06/2007 in Nijmegen) LOT-cursus Uitspraak en automatische spraakherkenning (11/06/2007 tot 15/06/2007 in Leuven) LOT-cursus Zelflerende systemen in de psycholinguïstiek (11/06/2007 tot 15/06/2007 in Leuven) Zie: http://www.taalunieversum.org/tst/ -------------------------------------------------------------------- 1. Themadag TST-centrale: stages in de TST-sector (Utrecht, 23/5) ***************************************************************** Ooit wel eens over nagedacht wat je allemaal kunt met je taal- of spraakstudie? Tijd om stage te lopen maar je weet nog niet waar? Op de themadag van de TST-centrale bieden verschillende taal- en spraaktechnologiebedrijven een kijkje in de praktijk. De ontwikkeling van taal- en spraaktechnologie is groeiend en er zijn mensen met veel uiteenlopende achtergronden aan het werk. Of je nu kunstmatige intelligentie, informatiekunde of taalwetenschap studeert, in de TST is er altijd wel een plekje voor je te vinden. Op 23 mei krijg je de gelegenheid om kennis te maken met deze wereld. Stagiairs en medewerkers van bedrijven zoals Q-go, Dutchear en Textkernel komen vertellen over hun ervaringen in de TST. Daarnaast worden er vacante stageplaatsen aangeboden en staan er bedrijven op de informatiemarkt waar je persoonlijk vragen kunt stellen. Wil je jouw toekomst een stapje voor zijn, kom dan naar de stagedag van de TST-centrale in Utrecht! Plaats: Hogeschool Domstad, Utrecht Toegang: gratis Het programma wordt zo spoedig mogelijk bekend gemaakt op de website. Wilt u vanuit uw organisatie of bedrijf een stand op de informatiemarkt verzorgen? Stuur dan voor aanmelding een e-mail naar tst-info@inl.nl. De TST-centrale is een initiatief van de Nederlandse Taalunie. Zie: http://www.tst.inl.nl/ -------------------------------------------------------------------- 2. Nederlandse Taalunie richt terminologiesteunpunt op ****************************************************** Sinds 1 april jl. is er een Steunpunt Nederlandstalige Terminologie (SNT). Het Steunpunt geeft informatie en advies over alle aspecten van Nederlandstalige terminologie. Verder voert het projecttaken uit voor de Vlaams-Nederlandse terminologievereniging NL-Term en voor de Commissie Terminologie. Deze Commissie houdt zich bezig met de voorbereiding van het terminologiebeleid van de Taalunie. Dat beleid is vooral gericht op de ontwikkeling van elektronische hulpmiddelen. De verantwoordelijkheid voor het Steunpunt ligt bij een samenwerkingsverband van twee organisaties: de Vrije Universiteit Amsterdam en het taaltechnologische bedrijf Cross Language nv uit Gent. De Taalunie heeft hiertoe besloten na een openbare aanbestedingsprocedure. Gebruikers van terminologie kunnen bij het Steunpunt terecht met al hun vragen. Als het Steunpunt niet zelf kan antwoorden, verwijst het door naar de juiste instantie. Het Steunpunt geeft ook advies op maat aan bedrijven of organisaties, vertalers, terminologen, docenten en vakexperts. Bovendien kan het Steunpunt helpen bij het zoeken van partners, applicaties, terminologiecollecties en dergelijke. Het Steunpunt onderhoudt in opdracht van de Nederlandse Taalunie de website www.nedterm.org. NedTerm is een onderdeel van het Taalunieversum, de website van de Taalunie. NedTerm geeft informatie over alles wat er in Nederland en Vlaanderen op het gebied van terminologie bestaat en gebeurt. De Taalunie wil met de oprichting van het Steunpunt bijdragen aan een betere professionele ondersteuning van het terminologiewerk in Vlaanderen en Nederland en tot een stroomlijning van de informatie- en documentatie op dit terrein. Zie: http://www.nedterm.org/ -------------------------------------------------------------------- 3. TST-centrale lanceert update e-Lex en nieuwe product sheets ************************************************************** De TST-centrale beschikt over e-Lex, een lexicale databank van het Nederlands, met circa 220.000 trefwoorden en meer dan 600.000 woordvormen. De ingangen (entrys) van het lexicon zijn voorzien van morfologische, syntactische en fonologische informatie. Een deel van de trefwoorden is ook voorzien van semantische informatie. Het is een breed inzetbaar computationeel lexicon voor de ontwikkeling van taal- en spraaktechnologische applicaties. In de periode van november 2006 tot februari 2007 heeft een update van het lexicon plaatsgevonden. De kolommen 'lem' (lemma) en 'wordf' (woordvorm) zijn automatisch op fouten onderzocht en vervolgens handmatig gecorrigeerd. Dit heeft geresulteerd in e-Lex versie 1.1. Daarnaast heeft de TST-centrale vier nieuwe Product Sheets van beschikbare TST-producten op haar website geplaatst: het 5 Miljoen Woorden Krantencorpus, het 27 Miljoen Woorden Corpus 1996, het 38 Miljoen Woorden Corpus en e-Lex 1.1. De Product Sheets geven zowel inhoudelijke als technische informatie zo beknopt en duidelijk mogelijk weer. U kunt het pdf-bestand downloaden door naar het betreffende product in de productenlijst te gaan. Het bestand is tevens geschikt om af te drukken. In de toekomst wordt voor elk product van de TST-centrale een Product Sheet gemaakt. Zo heeft u per product alle essentiële informatie in een beknopt en overzichtelijk document op een rij! De TST-centrale is een initiatief van de Nederlandse Taalunie. Zie: http://www.tst.inl.nl/ -------------------------------------------------------------------- 4. Snelle opmars spraakherkenning in contactcenters *************************************************** Van alle contactcenters maakt 13,5 procent gebruik van spraakherkenning, terwijl 24,7 procent plannen heeft om deze technologie te implementeren. Dit blijkt uit het Global Contact Centre Benchmarking-onderzoek 2007 van Dimension Data, dat op 19 maart is verschenen. De stijgende populariteit van technologie voor spraakherkenning is een logisch vervolg op reeds breed ingezette online selfservicemogelijkheden in contactcenters. Aangezien voor veel mensen spraak de meest voor de hand liggende vorm van communicatie is, voorspelt het Benchmarkingonderzoek 2007 dat organisaties steeds vaker spraaktechnologieën zullen inzetten om eenvoudige contactcentervragen af te handelen. Gebruikers zullen deze technologie op grote schaal gebruiken, waardoor de efficiëntie aanzienlijk te verbeteren is. In de reis- en transportsector is het aantal bedrijven dat overweegt om in de komende achttien maanden spraaktechnologie in te zetten het grootst; bijna de helft van de bedrijven (41,9 procent) is dit van plan. Volgens Cara Diemont, auteur van het Dimension Data Global Contact Center Benchmarking Report, levert selfservice op basis van spraak in een contactcenter grote voordelen op: "Bedrijven profiteren hier enorm van. Met een gedegen implementatie zullen grote aantallen klanten een beroep doen op spraakselfservice. Als organisaties deze service bovendien toepassen voor de juiste processen, vergroten ze hun efficiëntie en realiseren ze besparingen. Ook klanten plukken de vruchten van deze mogelijkheid, bijvoorbeeld omdat de dienst 24x7 beschikbaar is." Andere voordelen voor klanten zijn snellere servicetoegang en het ontbreken van wachtrijen. Zie: http://www.dimensiondata.com/nl/ -------------------------------------------------------------------- 5. Hotel reserveren met spraakherkenning **************************************** Horecaconcern Van der Valk Hotels & Restaurants is een nieuwe dienst gestart: Valkmobiel.nl Geregistreerde klanten kunnen 0900-456VALK (0900-4568255) bellen om een kamer, zaal of tafel bij Van der Valk te reserveren. De reservering gaat dan via een spraakherkenningsysteem dat geleverd is door Telecats, aanbieder van voice response en spraakherkenningtoepassingen ten behoeve van het automatiseren van telefoongesprekken en Voice over IP oplossingen. Al enige tijd biedt Van der Valk Hotels & Restaurants aan grote bedrijven en organisaties de mogelijkheid om een corporate overeenkomst aan te gaan. De medewerkers kunnen dan tegen vooraf afgesproken condities overnachten, lunchen/dineren of vergaderen bij de vestigingen van Van der Valk Hotels & Restaurants. Het boeken van de kamer, zaal of tafel gaat via een spraakherkenningtoepassing die is gemaakt door Telecats. De klant geeft door simpelweg de vragen te beantwoorden de reservering door. Deze spraakherkenningtoepassing is nu ook beschikbaar voor individuele gebruikers. Belangstellenden kunnen, na online registratie, met hun mobiele telefoon binnen 2 minuten een kamer reserveren. Gerard Schomaker, general manager Van der Valk Internet: "We verwachten dit jaar 5% van alle online boekingen via deze dienst te realiseren. We zijn de eerste horecaorganisatie die met deze nieuwe technologie operationeel is." Zie: http://www.telecats.nl/ -------------------------------------------------------------------- 6. Strategische samenwerking Telisma en Dutchear ************************************************ Telisma recently joined forces with Dutchear, the Dutch speech applications expert, to provide high quality speech driven telephony applications. Through the signature of a VAR agreement, Dutchear now resells the teliSpeech technology, integrating in its offer the newly improved version of its Dutch engine. This version benefits from months of optimisation and tuning based upon an extensive real- life speech database, which translates into top recognition rates. The joint solution will be called upon to implement corporate speech services, such as automated call centres and corporate directory assistance in the Dutch speaking market. In particular, it will rely on telisma's ability to deal with extra-large vocabularies to address the mass market, namely the automated information services or complex self-service applications. Also, thanks to the telismas tool kits which allow for rapid and easy creation of dialects, Dutchear is now able to address the Flemish speaking market. Using the teliSpeech Tuning Tool Kit Advanced Edition (TTK AE), Dutchear can create in no time a specific dialect to fit this specific Belgian accent, pronunciation and vocabulary, by enhancing the Dutch on both the acoustic and lexical levels. According to Victor Huisman, CEO Dutchear: "We have run a battery of tests on the newly introduced telisma Dutch language and are really enthusiastic with the performance of teliSpeech. As a speech recognition integrator we are continually looking for speech recognition performance and quality improvement. With teliSpeech, we have found the right technology to go further in performance." Laurent Balaine, telisma CEO, commented: "The alliance with Dutchear, an expert speech recognition player with a strong understanding of customer requirements is great news for telisma." Zie: http://www.dutchear.nl/ -------------------------------------------------------------------- 7. Website (ver)taaltechnologieteam Hogeschool Gent *************************************************** Het LT3 (Language and Translation Technology Team) taal- en vertaaltechnologieteam is een jonge onderzoeksgroep ingebed in het Departement Vertaalkunde van de Hogeschool Gent. De groep heeft een aparte website geopend. Het gezamenlijke team werd pas boven het doopvont gehouden in de loop van 2006, maar het kan bogen op een brede ervaring van het departement op het gebied van terminologisch en vertaalkundig onderzoek. Door een bijkomende prioritaire focus op de ontwikkeling van parallelle corpora en op corpusgebaseerd taal- en vertaaltechnologisch onderzoek is het onderzoek van het team nu opgebouwd rond de volgende drie pijlers: * Terminologie: terminologisch en terminografisch onderzoek en opbouw van termenbanken * Parallelle corpora: aanleg van parallelle corpora voor vertaalkundig en vertaaltechnologisch onderzoek * Technologie: (ver)taaltechnologisch onderzoek en ontwikkeling van corpusgebaseerde taal- en vertaaltechnologische applicaties Contactpersoon voor het domein taaltechnologie is dr. Véronique Hoste. Zie: http://veto.hogent.be/lt3/ -------------------------------------------------------------------- 8. Afstudeerstage emotionele spraaksynthese (TNO Soesterberg) ************************************************************* Binnen de afdeling Human Interfaces van TNO Defensie en Veiligheid in Soesterberg wordt onderzoek gedaan naar mens-machine interfaces. Een onderdeel van zon interface kan zijn het automatisch omzetten van tekst naar spraak (spraaksynthese). In de meeste commerciële spraaksynthese-programmas is het niet mogelijk om de spraak te voorzien van emotie. Doel van dit onderzoek is om te onderzoeken in hoeverre met bestaande 'open-source' of commerciële spraaksynthese systemen emotionele spraak te genereren of te manipuleren is. De stage bestaat uit twee fases: een literatuurstudie en een luisterexperiment. In de literatuurstudie zal onderzocht worden welke akoestische parameters correleren met emotie. Hierbij wordt gebruik gemaakt van een dimensioneel model van emotie (dimensies: valence, activation en evt. power). Er zal bekeken worden of het mogelijk is om met bestaande 'open-source' of commerciële spraaksynthe-software de relevante akoestische parameters te manipuleren. In het luisterexperiment zal onderzocht worden of manipulatie van het spraaksignaal het gewenste effect heeft op de perceptie van de emotiedimensie(s). Wat vragen we van jou? · een opleiding op universitair niveau; bij voorkeur fonetiek, taalwetenschap, kunstmatige intelligentie, natuurkunde, wiskunde of informatica · kennis en ervaring met signaalbewerkingsalgorithmen · in bezit van een paspoort van een NAVO lidstaat (i.v.m. screening) · beheersing Nederlands (i.v.m. Nederlandse spraaksynthese) · affiniteit met onderzoek · zelfstandig kunnen werken · een collegiale instelling met bijbehorende communicatieve vaardigheden · je bent ondernemend en initiatiefrijk Meer informatie bij Judith Kessens, judith.kessens@tno.nl. -------------------------------------------------------------------- 9. Training fellowships in Sound to Sense-netwerk ************************************************* Sound to Sense (S2S) is a Marie Curie Research Training Network involving collaborative speech research amongst 13 universities in 10 countries. 18 Training Fellowships are available, of which 12 are predoctoral and 6 postdoctoral (or equivalent experience). Most but not all are planned to start in September or October 2007. A research training network's primary aim is to support and train young researchers in professional and inter-disciplinary scientific skills that will equip them for careers in research. S2S's scientific focus is on cross-disciplinary methods for modelling speech recognition by humans and machines. Distinctive aspects of our approach include emphasis on richly-informed phonetic models that emphasize communicative function of utterances, multilingual databases, multiple time domain analyses, hybrid episodic-abstract computational models, and applications and testing in adverse listening conditions and foreign language learning. Eleven projects are planned. Each can be flexibly tailored to match the Fellows' backgrounds, research interests, and professional development needs. Two projects are planned to be hosted in the Netherlands and one in Flanders: - Automatic methods to identify FPD: Corpus-based probabilistic work (Radboud U, Nijmegen; Baayen, Svendsen) - Lexical decoding of speech using sub-phonemic features (Radboud U, Nijmegen; ten Bosch, Moore) - Hybrid episodic-abstract computational modelling: ASR (Katholieke U, Leuven; Van Compernolle, Moore) There is no deadline for applications, but applications received by 1st May 2007 will be considered by mid-May. Zie: http://www.ling.cam.ac.uk/s2s/s2sJobAd.pdf -------------------------------------------------------------------- 10. Vacature postdoc memory-based language modeling & MT (Tilburg) ****************************************************************** The Induction of Linguistic Knowledge research group of Tilburg University's Department of Communication and Information Sciences (Faculty of Humanities) has an opening for a full-time postdoc researcher (three years). Application deadline: April 20, 2007. The position, funded by the Netherlands Organization for Scientific Research (NWO), is part of the Vici project "Implicit linguistics: Machine learning of text-to-text processing", focusing on memory- based language modeling and machine translation. Memory-based language modeling is a classification-based take on the classical problem of predicting the next or the missing word in a sequence, and has applications ranging from spelling correction to language modeling for speech recognition and machine translation. Memory- based machine translation, analogously, is a new classification- based implementation of example-based machine translation. Underlying both goals is the development of highly scalable and parallelizable memory-based classifiers (based on the TiMBL class of algorithms developed at Tilburg University) trained on very large monolingual and bilingual textual corpora. We are looking for an enthusiastic researcher to complete the five- person team for this project, which also consists of a Ph.D. student, two part-time scientific programmers, and project leader Antal van den Bosch. The person to do this should have a PhD in computational linguistics, computer science, or a related area, preferably with a strong track record in machine learning of natural language, or in data-driven methods for machine translation. Programming skills and a good command of English (both spoken and written) are required. The project calls for an all-round team player who knows how to do fundamental research, who likes creating natural language processing software, and who enjoys coaching students and junior researchers. Zie: http://ilk.uvt.nl/jobs/ilk2007-vici/ -------------------------------------------------------------------- 11. Diverse vacatures promovendi CLCG (Groningen) ************************************************* The Center for Language and Cognition Groningen (CLCG) announces eight graduate fellowships (all PhD positions). The positions are open to qualified applicants from all over the world. Naturally, Dutch citizens are also eligible for these fellowships. The positions will preferentially be filled in one of the following research groups: - computational linguistics - neurolinguistics - language variation and language change. Application deadline: May 1, 2007. The CLCG also announces two PhD positions (90%) in Modelling Discourse Structure. The successful candidates will participate in the NWO-funded research programme 'Modelling Discourse Structure'. This programme investigates the hierarchical organisation of textual units into structured entities by the joint contributions of relational coherence (the way smaller textual units combine into larger ones) and lexical cohesion (relations between elements within textual units, e.g., synonyms, anaphora, or collocations). Corpora from different genres (journalistic, encyclopaedic, and persuasive texts) will be investigated to take into account genre-dependent differences in textual organisation. Application deadline: May 5, 2007. Finally, the following position is still open: PhD position (90%) in Applications of Algorithms for Linguistic Processing in Action: Dutch. In the recently completed PIONIER research project Algorithms for Linguistic Processing, a collection of related techniques and tools for wide-coverage computational analysis of Dutch have been developed. In the current project, we seek answers to advanced research questions in the area of the computational analysis of Dutch, building on the results of the earlier project. Zie: http://www.rug.nl/let/onderzoek/onderzoekinstituten/clcg/positions/ -------------------------------------------------------------------- 12. Vacature onderzoeksmedewerker toegep. communicatie (Antwerpen) ****************************************************************** In het kader van een onderzoeksproject van de Vakgroep Zakelijke Communicatie (Faculteit Toegepaste Economische Wetenschappen - Departement management) van de Universiteit Antwerpen in samenwerking met het Hoger Instituut voor Vertalers en Tolken (Hogeschool Antwerpen) is de volgende voltijdse onderzoeksplaats vacant: Onderzoeksmedewerker Toegepaste Communicatie Live ondertiteling met spraaktechnologie Het betreft een tijdelijke aanstelling voor een termijn van 15 tot 17 maanden, in het statuut van Dehousse-bursaal (startdatum augustus 2007). U verricht wetenschappelijk onderzoek dat kan leiden tot een proefschrift. Het thema van het onderzoek is 'Live-ondertiteling met spraaktechnologie: Procedure voor kwaliteitsverbetering'. Het betreft een project van de Associatie Antwerpen met samenwerking tussen het Hoger Instituut voor Vertalers en Tolken (HIVT), de Universiteit Antwerpen (Dept. Management) en de VRT. Een uitgewerkt onderzoeksvoorstel vormt de basis van de aanstelling (verkrijgbaar op aanvraag). U besteedt minimaal 80% van uw tijd aan wetenschappelijk onderzoek. U verleent (beperkte) assistentie bij het onderwijs. Solliciteren kan tot 1 mei 2007. Zie: http://www.ua.ac.be/main.aspx?c=*VACATURES --------------------------------------------------------------------
©
Nederlandse Taalunie, 2000-2008 alle rechten voorbehouden
Wegwijzer – Colofon – Contact – Vrijwaring – Opmerkingen en reacties
Wegwijzer – Colofon – Contact – Vrijwaring – Opmerkingen en reacties
