Taal- en spraaktechnologienieuws februari 2007 ********************************************** 0. TST op de agenda 1. STEVIN: zes demonstratieprojecten goedgekeurd 2. Lezingen over taaltechnologietoepassingen (Leuven, 12/2-8/3) 3. Symposium over virtuele communicatieondersteuning (Leuven, 28/4) 4. N-Best 2008: Oproep voor deelname aan evaluatie spraakherkenners 5. Is de computer een goed verstaander? 6. Interview met Markus Egg over computationeel discourse-onderzoek 7. WNT gratis op internet raadpleegbaar 8. Acapela en Assistiveware lanceren TextParrot 9. Oproep voor bijdragen over zangsynthese 10. Vacature promovendus ACORNS-project CLST (RU Nijmegen) 11. Vacatures computerlinguist en student-assistenten (K.U. Leuven) Heeft u ook een nieuwsbericht of een aankondiging, dan vernemen wij dat graag (sluitingsdatum volgend nummer: 2/3/7). Deze en voor- gaande edities van Taal- en spraaktechnologienieuws zijn on-line beschikbaar op http://taalunieversum.org/taal/technologie/nieuwsbrief/. ==================================================================== U ontvangt dit bericht omdat uw gegevens zijn opgenomen in de taal- en spraaktechnologiedatabank van de Nederlandse Taalunie (www.taalunieversum.org/tst). Wijzigingen voor deze databank kunt u melden via tst@taalunie.org - dank u wel! ==================================================================== -------------------------------------------------------------------- 0. TST op de agenda ******************* Colloquium Taal en Spraak: muziek en perceptie � 07/03/2007 in Nijmegen Nederlands-Belgische workshop Information Retrieval (DIR2007) � 28/03/2007 tot 29/03/2007 in Leuven Colloquium Taal en Spraak: TST voor kleine talen � 04/04/2007 in Nijmegen Europese Top Tekstanalyse � 26/04/2007 tot 27/04/2007 in Amsterdam Symposium Virtuele communicatieondersteuning � 28/04/2007 in Leuven Zie: http://www.taalunieversum.org/tst/ -------------------------------------------------------------------- 1. STEVIN: zes demonstratieprojecten goedgekeurd ************************************************ In de tweede ronde voor demonstratieprojecten in het STEVIN- programma zijn zes projectaanvragen goedgekeurd: * Audiokrant (Sensotec, De Braillekrant en K.U.Leuven - SCD) - de krant voor mensen met een leeshandicap conform de internationale Daisy-standaard. * Spelling- en grammaticacontrole voor dyslectische gebruikers (Polderland Language & Speech Technology, Technologie & Integratie en Die-'s-lekti-kus) - aanpassing van de standaard spellingcontrole en grammaticacontrole in Microsoft Office zodanig dat ze beter aansluiten bij de typische fouten die dyslectici maken. * Rechtspraakherkenning (Telecats en Carp Technologies) - hulpmiddelen om de tijd aanzienlijk te verkorten die gemoeid is met het volledig uitschrijven van de geluidsopnamen in de rechtszaal. * Klare taal bij de overheid (GridLine, Universiteit Utrecht - UiL OTS, K.U.Leuven - CCL, Stichting Toepassing Inductieve Leertechnieken, Provincie Brabant en Gemeente Den Haag - Dienst Voorlichting en Ext. Betrekkingen) - dynamische jargonbewaker om de leesbaarheid van publieksgerichte communicatie van overheidsinstellingen te verbeteren. * Spellingchatbot (INL - dependance Vlaanderen, Elitech, Polderland Language & Speech Technology, Van Dale Lexicografie) - chatbot die direct het juiste antwoord geeft op spellingvragen gesteld via MSN, sms of de webbrowser. * Voice Assess (Telecats en VO Consulting) - applicatie voor een goede automatische voorselectie van kandidaten voor het werken in call centers, waarbij met spraakherkenning gemeten wordt of bepaalde essenti�le woorden wel of niet gezegd zijn. Zie: http://www.stevin-tst.org/. -------------------------------------------------------------------- 2. Lezingen over taaltechnologietoepassingen (Leuven, 12/2-8/3) *************************************************************** Van 12 februari tot 8 maart 2007 vindt aan de K.U. Leuven een reeks van twaalf lezingen plaats over 'Language Engineering Applications'. De lezingen zijn toegankelijk voor al wie ze wil bijwonen. Vooraf aanmelden is niet nodig. De volgende onderwerpen komen aan bod: * corpusconstructie en -annotatie � 12/02/2007 * ontwikkelen van een spraakherkenner - 14/02/2007 * syntactische annotatie � 15/02/2007 * computationele lexicografie - 19/02/2007 * proofing tools � 21/02/2007 * hulpmiddelen voor gehandicapten (1) - 22/02/2007 * het ACORNS-project � 26/02/2007 * meertalige documentgeneratie en MT � 28/02/2007 * hulpmiddelen voor gehandicapten (2) � 01/03/2007 * ontwerp van een leestutor � 05/03/2007 * meertalige document-retrieval - 07/03/2007 * dialoogdescriptie en Voice-XML - 08/03/2007 Zie: http://www.ccl.kuleuven.be/Courses/LEA -------------------------------------------------------------------- 3. Symposium over virtuele communicatieondersteuning (Leuven, 28/4) ******************************************************************* Dit symposium handelt over verschillende communicatiemiddelen die ingezet kunnen worden voor klinische en educatieve toepassingen. De verschillende sprekers zijn experten op gebied van de ontwikkeling van virtuele therapeuten voor dyslectische, spraakgestoorde of gehoorgestoorde kinderen en volwassenen (zie bijbehorende websites). Er zullen diverse demonstraties gegeven worden. 9.00 Inventing virtual teachers and therapists. Ron Cole (University of Colorado, USA) 10.30 Pauze 11.00 Tutor that Listens. Jack Mostow (Carnegie Mellon University, USA) 12.15 Lunchpauze 13.30 Naar een geautomatiseerde leesvaardigheidsproef voor het Nederlands: het SPACE-project. Hugo Van Hamme (ESAT, K.U.Leuven) 14.00 Uitspraakevaluatie & training met behulp van spraaktechnologie. Helmer Strik (RU Nijmegen) 14.30 Spraakanalyse en synthese voor bijzondere doelgroepen. Werner Verhelst (Vrije Universiteit Brussel) 15.00 Spraak- en taaltechnologie voor Nederlandstalige personen met beperkingen: wat is er reeds beschikbaar? Dirk Lembrechts (Modem) 15.30 Einde Organisatie: Logopedische en Audiologische Wetenschappen K.U.Leuven, Lessius Hogeschool Antwerpen, Katholieke Hogeschool Brugge-Oostende. Inschrijving en betaling v��r 8 april 2007. Zie: https://gilbert.med.kuleuven.be/web/index.php/Public:Symposium -------------------------------------------------------------------- 4. N-Best 2008: Oproep voor deelname aan evaluatie spraakherkenners ******************************************************************* In 2006 the Dutch research programme STEVIN granted funding to the project N-Best. This project aims at setting up the infrastructure for a benchmark evaluation in large vocabulary speech recognition for the Dutch language, and at conducting such an evaluation. This is a call to the speech recognition research community to participate in this evaluation. The evaluation is conducted by TNO Human Factors in Soesterberg, the Netherlands in co-operation with SPEX in Nijmegen. The evaluation paradigm is similar to that of the well known NIST speech technology evaluations. The evaluation is scheduled to be held in the spring of 2008, with an optional dry run in September 2007. Two large vocabulary speech recognition tasks will be covered in the evaluation data, Broadcast News (BN) and Conversational Telephone Speech (CTS). Two main dialect regions will be defined in the evaluation, Northern and Southern Dutch, as spoken by people from The Netherlands and Flanders (Belgium), respectively. In order to facilitate development of speech recognition systems for Dutch, sources for acoustic and textual training material have been located. These are the Spoken Dutch Corpus (Corpus Gesproken Nederlands, CGN) and text data from Dutch and Flemish newspapers. TNO is currently making the effort to streamline obtaining research licenses to these data for use in N-Best. The evaluation will be followed by a workshop, in which the results are presented and participants can present and discuss their approach to the evaluation task. One of the goals of the project is to produce a journal article describing the evaluation and the research approaches taken therein. A first evaluation plan with rules and dates is available from the N-Best evaluation website. Zie: http://speech.tm.tno.nl/n-best/eval/. -------------------------------------------------------------------- 5. Is de computer een goed verstaander? *************************************** Een goed verstaander... maakt dit spreekwoord moeiteloos af. Meestal is een half woord al voldoende om te begrijpen wat er gezegd wordt. In de tentoonstelling "Bent u een goed verstaander?" kunt u zelf experimenteren met taal. Van 26 januari t/m 13 mei 2007 is deze kleine tentoonstelling over optimale communicatie te bekijken en te beluisteren in het Universiteitsmuseum in Groningen. Daarvoor stond de tentoonstelling in het Universiteitsmuseum in Utrecht. Begrijpen en verstaan doen we dagelijks ontelbare keren zonder daar verder bij stil te staan. Het grootste deel van de tijd gaat dit goed. En dat terwijl er zoveel mis kan gaan. Deze tentoonstelling maakt u hiervan bewust en zet uw hersenen keer op keer voor het blok. U kunt onder meer ervaren dat computers en kinderen (nog) niet zulke goede verstaanders zijn. In Groningen heeft drs. Gerlof Bouma een computerprogramma ontwikkeld dat ondanks een gebrek aan wereldkennis toch in veel gevallen de juiste betekenis van woorden als 'hij' en 'zij' kan bepalen. De computer maakt daarvoor gebruik van regels, die met elkaar in conflict kunnen zijn. De computer zoekt dan naar de 'beste' of 'optimale' betekenis. U kunt dit computerprogramma aan het werk zetten op de tentoonstelling. Bedenk zelf een stukje tekst en test het taalbegrip van de computer. Zie: http://www.let.rug.nl/~hendriks/tentoon/. -------------------------------------------------------------------- 6. Interview met Markus Egg over computationeel discourse-onderzoek ******************************************************************* In de serie "Interviews met CLCGers over Taalkunde" van John Nerbonne is sinds kort ook een vraaggesprek met universitair hoofddocent en discourse-onderzoeker Markus Egg beschikbaar. "De vooruitgang in de computationele lingu�stiek en de taaltechnologie die door syntactisch geannoteerde corpora is geboekt, is zo enorm dat hij grootschalige projecten voor de annotatie van corpora ook met discourse-structuur heeft gestimuleerd. Onze bijdrage aan deze taak is de ontwikkeling van semi-automatische analysemethoden voor discourse-structuur op basis van syntactische structuren. Zo kunnen grote hoeveelheden tekst met een hoge inter-rater-reliability annoteerd worden. Ik verwacht dat zulke corpora een belangrijke bijdrage kunnen bieden aan discourse- onderzoek, bijv. de samenhang tussen discourse-structuur en cohesie- middelen zoals anaforen en lexicalische relaties of verdere inzicht in genre-afhankelijke structuurverschillen." Zie: http://www.let.rug.nl/nerbonne/misc/clcg-interviews/. -------------------------------------------------------------------- 7. WNT gratis op internet raadpleegbaar *************************************** Sinds eind januari is het Woordenboek der Nederlandsche Taal (WNT) gratis op het internet raadpleegbaar. Het WNT bevat honderdduizenden verklaringen van Nederlandse woorden en een veelvoud daarvan aan aanhalingen uit bronnen uit de periode tussen ongeveer 1500 en 1976. Alle trefwoorden kunnen worden opgevraagd in hun originele spelling uit 1863, maar ook in de moderne spelling. Daarnaast is het onder andere mogelijk te zoeken naar delen van woorden (bijv. achtervoegsels, voorvoegsels), naar woordcategorie�n (bijv. tussenwerpsels, voegwoorden) of naar termen die in betekenisverklaringen gebruikt zijn (bijv. alle woorden die de term plant of schip in de betekenisverklaring hebben). In het WNT online zijn ook koppelingen aangebracht naar informatie buiten het woordenboek. Zo zijn bijvoorbeeld alle woorden uit de tot nu toe verschenen delen van het Etymologisch Woordenboek van het Nederlands, met de recentste ontwikkelingen op etymologisch gebied, gekoppeld aan hun equivalent in het WNT. Verder zijn er koppelingen naar overeenkomstige woorden in het Afrikaans, afbeeldingen van planten en dieren en dialectkaarten. Het raadplegen van het WNT online is gratis en gemakkelijk. Na een eenmalige registratie als gebruiker van dit product kan men het woordenboek raadplegen waar en wanneer men maar wil. Voor instellingen is het nog eenvoudiger om het WNT online te raadplegen, want deze hebben vrij toegang tot dit product op basis van hun IP- adres. Deze onlineversie van het Woordenboek der Nederlandsche Taal is het eerste onderdeel van het project 'Historische woordenboeken van het Nederlands online' van de afdeling Taalbank van het Instituut voor Nederlandse Lexicologie. Het WNT online wordt via de Nederlandse Taalunie gefinancieerd door het Ministerie van OCW en het Ministerie van de Vlaamse Gemeenschap. Zie: http://wnt.inl.nl/. -------------------------------------------------------------------- 8. Acapela en Assistiveware lanceren TextParrot *********************************************** Acapela and AssistiveWare have launched TextParrot, the first product of the new "ConvenienceWare" family, a set of products designed to make advanced technologies available in convenient applications for Mac users. TextParrot 1.0 is a multilingual speech solution for Mac OS X that allows users to listen to documents with Acapela's natural sounding voices. Using Acapela text to speech, TextParrot literally converts any written text into speech, capable of transforming any type of information in real-time. TextParrot includes voices in US English, UK English, French, German, Italian, Danish, Dutch, Flemish, Spanish, Portuguese, Norwegian and Swedish. Note that these special ConvenienceWare voices will not work in other applications. Zie: http://www.acapela-group.com/, http://www.assistiveware.com/. -------------------------------------------------------------------- 9. Oproep voor bijdragen over zangsynthese ****************************************** SYNTHESIS OF SINGING CHALLENGE, Special Session at INTERSPEECH 2007 Singing is perhaps the most expressive usage of human voice and speech. An excellent singer, whether in classical opera, musical, pop, folk music, or any other style, can express a message and emotion so intensely that it moves and delights a wide audience. Synthesizing singing may be considered therefore as the ultimate challenge to our understanding and modeling of human voice. In this two hours interactive special session of INTERSPEECH 2007 on synthesized singing, we hope to present an enjoyable demonstration of the current state of the art, and we challenge you to contribute! The session will be special in many ways: * Participants have to submit a composition of their own choice, and they have to produce their own version of a compulsory musical score. * During the special session, each participant will demonstrate the free and compulsory composition, with additional explanation. * The contribution will be commented by a panel consisting of synthesis experts and singers, and the audience. * Evaluative statements will be voted for by everyone, if possible by a voting box system. * The most preferred system will be allowed to play the demonstration during the closing session of the conference. If you are interested to join the challenge, you are invited to submit a paper on your system and to include an example composition of your own choice (in .wav format) within the regular submission procedure of INTERSPEECH 2007, and to select "Synthesis of Singing Challenge" as special session. The deadline is March 23, 2007. We also offer a light submission procedure that will not result in a regular peer reviewed paper in the Proceedings. In that case you can submit the composition of your own choice in .wav format to the session organizer before April 27, 2007. Zie: http://www.interspeech2007.org/. -------------------------------------------------------------------- 10. Vacature promovendus ACORNS-project CLST (RU Nijmegen) ********************************************************* Acquisition of Communication and Recognition Skills (ACORNS) is a highly ambituous project, financed by the European Commission, which aims to develop a computer simulation of the way in which young children acquire their native language. For this project we are looking for a PhD candidate who will be based at the Centre for Language and Speech Technology at the Radboud University Nijmegen. The task of the PhD student will be to develop an autonomous language acquisition system by integrating software modules that are built by other partners of the project consortium. Further s/he will conduct experiments with the system in order to evoke adequate reactions from the system to audio-visual input. On the basis of the feedback to the reactions, the system should learn to recognise words and their meanings in speech signals. The PhD student will have the opportunity to conduct part of the research in the lab of one of the ACORN Consortium members in Belgium, Great Brittain, Sweden, Finland, or the USA. A successful candidate must have a strong background in informatics, cognitive sciences, AI, and preferably signal processing and pattern recognition. Due to the international context of the project, excellent coomunication skills in English are essential, as well as a good record of collaboration in teams. Candidates must be already authorized to work in the EU. Duration of contract: 3.5 years. Closing date: 18 February 2007 Zie: http://www.ru.nl/clst/ -------------------------------------------------------------------- 11. Vacatures computerlinguist en student-assistenten (K.U. Leuven) ******************************************************************* Het Centrum voor Computerlinguistiek van de K.U.Leuven heeft vacatures voor (1) een computerlinguist (voltijds, junior) en (2) student-assistenten (deeltijds). Zie: http://www.ccl.kuleuven.be/vacature.php --------------------------------------------------------------------
©
Nederlandse Taalunie, 2000-2009 alle rechten voorbehouden
Wegwijzer – Colofon – Contact – Vrijwaring – Opmerkingen en reacties
Wegwijzer – Colofon – Contact – Vrijwaring – Opmerkingen en reacties
