Taal- en spraaktechnologienieuws april 2008 ********************************************************************** 0. TST op de agenda 1. Ontwikkeling groot corpus geschreven Nederlands kan doorgaan 2. NEON: Onderzoek naar sneller, beter en goedkoper ondertitelen 3. Vernieuwde website van INL en TST-Centrale 4. Taaltechnologie ingezet voor ontwikkeling computerspel 5. Nuance lanceert wedstrijd "Ik Spreek Dragon!" 6. E-Optimaal biedt gebruikers nieuwe Voice-module 7. Vacature voor Promovendus MEMPHIX-project Tilburg Heeft u ook een nieuwsbericht of een aankondiging, dan vernemen wij dat graag (sluitingsdatum volgend nummer: 17/05/08). Deze en voorgaande edities van Taal- en spraaktechnologienieuws zijn on-line beschikbaar op http://taalunieversum.org/tst/nieuwsbrief/. ====================================================================== U ontvangt dit bericht omdat uw gegevens zijn opgenomen in de taal- en spraaktechnologiedatabank van de Nederlandse Taalunie ( http://taalunieversum.org/tst/). Wijzigingen voor deze databank kunt u melden via tst@taalunie.org - dank u wel! ====================================================================== ---------------------------------------------------------------------- 0. TST op de agenda ********************************************************************** - Innovatiecongres ICTDelta (08/05 in Utrecht) - Symposium Klinkende Taal over begrijpelijk taalgebruik (14/05 in Utrecht) - Belgisch-Nederlandse conferentie Machine Learning (Benelearn08) (19/05 tot 20/05 in Spa) - Themadag Innovatiegerichte Onderzoeksprogramma's (IOP's) (20/05 in Rotterdam) - Conferentie over nieuwe benaderingen in de tekstlinguïstiek (22/05 tot 24/05 in Brussel) - Automatische emotieherkenning in spraak (23/05 in Soesterberg) - KansRijk 2008 (05/06 in Nieuwegein) - Workshop semantische technologieën voor systeemonderhoud (09/06 in Amsterdam) - Bijeenkomsten STEVIN en IMIX (25/06 tot 27/06 in Rotterdam) Zie: http://taalunieversum.org/tst/ ---------------------------------------------------------------------- 1. Ontwikkeling groot corpus geschreven Nederlands kan doorgaan ********************************************************************** STEVIN is een meerjarig onderzoeks- en stimuleringsprogramma voor Nederlandstalige taal- en spraaktechnologie dat gezamenlijk door de Vlaamse en Nederlandse overheid wordt gefinancierd. Een van de topprioriteiten van het STEVIN-programma is de realisatie van een groot corpus geschreven Nederlands. Een dergelijk corpus wordt van essentieel belang geacht voor de digitale infrastructuur van het Nederlands. Aan de Nederlandse kant van het Nederlands-Vlaams programma was de eerder toegezegde financiering hiervoor enige tijd onzeker. Inmiddels is duidelijk geworden dat de oorspronkelijke financiële verwachtingen alsnog waargemaakt kunnen worden. De ontwikkeling van het corpus geschreven Nederlands kan dus volgens plan worden uitgevoerd. Zie: http://taalunieversum.org/taal/technologie/stevin/ ---------------------------------------------------------------------- 2. NEON: Onderzoek naar sneller, beter en goedkoper ondertitelen ********************************************************************** Het Enschedese bedrijf Telecats gaat samen met drie gerenommeerde Vlaamse Universiteiten, de Nederlandse en Vlaamse publieke omroepen en met steun van de Nederlandse Taalunie, onderzoek doen naar manieren om Nederlands gesproken televisieprogramma`s sneller, beter en goedkoper te ondertitelen. De toepassing van taal- en spraaktechnologie speelt daarbij een belangrijke rol. Het onderzoeksproject kan een belangrijke bijdrage leveren aan het streven naar 100 procent ondertiteling voor doven en slechthorenden. Het NEON-project is een van de demonstratieprojecten van het STEVIN-programma. Zie: http://www.nvvs.nl/soap/_index.php?s_page_id=1000080 ---------------------------------------------------------------------- 3. Vernieuwde website van INL en TST-Centrale ********************************************************************** De websites van het INL en de TST-Centrale zijn vernieuwd. Het uiterlijk is opgefrist, de navigatie verbeterd en er is een begin gemaakt met de integratie van de website van de TST-Centrale in de INL-website. De rest van het jaar wordt er gewerkt aan verdere integratie van de twee websites. Daarnaast zal er een centrale login voor alle webapplicaties geïmplementeerd worden. Zie: http://www.inl.nl ---------------------------------------------------------------------- 4. Taaltechnologie ingezet voor ontwikkeling computerspel ********************************************************************** Onlangs is de Nederlandse versie van het computerspel "My Word Coach" uitgekomen voor zowel de Nintendo Wii als DS. Met het spel kan de woordenschat worden vergroot. De indeling van het spel in moeilijkheidsgraden is gebaseerd op de frequentiegegevens van een corpus van 600 miljoen woorden. Om de frequentie-informatie correct te kunnen gebruiken, zijn de woorden eerst met de taaltechnologische module Tadpole geanalyseerd. Tadpole is ontwikkeld aan de Universiteit van Tilburg en de Universiteit van Antwerpen. Zie: http://www.kennislink.nl/web/show?id=201797 ---------------------------------------------------------------------- 5. Nuance lanceert wedstrijd "Ik Spreek Dragon!" ********************************************************************** Nuance Communications lanceert de wedstrijd "Ik Spreek Dragon!" voor gebruikers van Dragon NaturallySpeaking. Gebruikers krijgen de kans om te vertellen hoe het product hun leven heeft veranderd en verbeterd. Per wedstrijdcategorie winnen de beste drie inzendingen een prijs. De wedstrijd loopt van 24 april tot 30 juni 2008. In de zomer van 2008 maakt Nuance de winnaars bekend. Zie: http://netherlands.nuance.com/dragonstories/ ---------------------------------------------------------------------- 6. E-Optimaal biedt gebruikers nieuwe Voice-module ********************************************************************** E-Optimaal, softwareontwikkelaar voor Exact Globe, heeft een nieuwe module die ondersteuning voor Voice Picking en Voice Response biedt. Exact-gebruikers kunnen kiezen voor zowel een spraakonafhankelijke als een spraakafhankelijke variant. Het gebruik van meerdere talen is hiermee ook mogelijk. De nieuwe module is ontwikkeld in nauwe samenwerking met hardwarepartner LXE. Zie: http://www.logistiek.nl/nieuws/id6320-EOptimaal_biedt_Exactgebruikers_nieuwe_Voicemodule.html ---------------------------------------------------------------------- 7. Vacature voor poromovendus MEMPHIX-project (UvT, Tilburg) ********************************************************************** The Department of Communication and Information Sciences has an opening for a PhD position for the project "MEMPHIX: MEMory-based paraPHrasing with Implicit and eXplicit semantics", which belongs to the research programme "Making Sense". The ability to paraphrase, i.e. to say the same thing in another way, can serve a variety of purposes. It can serve to explain something or to provide feedback in dialogue. Generating shorter paraphrases is useful for subtitles or news feeds. Paraphrasing can also change the register of a text: from formal speak to street language, or from old- fashioned prose to present-day language. In the MEMPHIX project, a system is built that learns to generate paraphrases on the basis of examples. The project makes use of a memory-based translation system (MBMT), developed within the NWO VICI project "Implicit Linguistics". The MBMT technology can be straightforwardly trained on pairs of paraphrases. While the generation of paraphrases can be driven in the first place by surface similarities (leaving semantics completely implicit, just as in a statistical MT system), explicit semantic information may also play a role, such as the semantic roles of NPs and the coreference relations between NPs and pronouns. Such information may be computed through automatic means (parsing, semantic role labeling, co-reference resolution). The project will compare the direct implicit route with the use of explicitly computed semantics. This part of the project will join forces with an international effort of the ISO organization aimed at developing semantic annotation formalisms with a well-defined semantics. The project will make use of a richly annotated Dutch corpus of 1 million words developed in the STEVIN Daeso-project, consisting of pairs of texts that express paraphrased or at least comparable information from various domains. While the Dutch language will be a core object of study, the methods are language-independent, and so other paraphrasing corpora will be considered as well to explore alternative routes to gather paraphrase subcorpora beyond the 1 million word scale. The MEMPHIX project will be carried out under the guidance of prof. dr. Antal van den Bosch, and will be aligned with the NWO VICI project "Implicit Linguistics" (Van den Bosch), the ISO project "Semantic Annotation Framework" (Prof. dr. Harry Bunt), and the STEVIN project "Daeso" (Tilburg partners: prof. dr. Emiel Krahmer and dr. Erwin Marsi). Zie: http://www.tilburguniversity.nl/faculties/humanities/dci/ ----------------------------------------------------------------------
©
Nederlandse Taalunie, 2000-2008 alle rechten voorbehouden
Wegwijzer – Colofon – Contact – Vrijwaring – Opmerkingen en reacties
Wegwijzer – Colofon – Contact – Vrijwaring – Opmerkingen en reacties
