Nieuwsberichten

Taal- en Spraaktechnologie voor visueel gehandicapten (VH)

07/04/2015

Een eerdere deelnemersbijeenkomst van NOTaS in 2014 die samen met de Taalunie was georganiseerd, wekte bij alle betrokkenen zoveel enthousiasme dat werd besloten een meer verdiepende bijeenkomst te houden met een groter aantal ervaringsdeskundige leden van de Oogvereniging.

Jeroen van Dijk en Ronald Willering (Oogvereniging) organiseerden deze bijeenkomst op 28 maart. Catia Cucchiarini (Taalunie) trad op als algemeen inleider en dagvoorzitter. Het thema van de bijeenkomst was "Spraaktechnologie voor blinden en slechtzienden". Henk van den Heuvel en Arjan van Hessen (bestuursleden van NOTaS) verzorgden een presentatie over taal- en spraaktechnologie, de stand van zaken qua bruikbaarheid en de toekomstige ontwikkelingen.

Tijdens de eerder NOTaS-bijeenkomst was al gesproken over de wensen en verlangens van de VH. Om een vollediger beeld te krijgen heeft de Oogvereniging haar leden verzocht deze wensen en verlangens op papier te zetten. Deze input stond centraal op 28 maart.

Wensen en verlangens
De genoemde onderwerpen lieten zich onderverdelen in drie categorieën: domotica, internet en ICT en mobiliteit, waarbij Domotica meer dan de helft van de wensen representeerde.

Domotica
In een wereld die steeds complexere apparaten bevat en waar de gebruikers deze apparaten met een steeds "strakkere" interface willen bedienen, wordt het voor de VH lastiger om nog bij te blijven. Deze ontwikkelingen beperken zich niet tot tablets en telefoons: ook bijvoorbeeld keramische kookplaten bevatten touch-knoppen die je op de glasplaat niet kunt voelen (maar wel kunt zien). Ook slotte werd het bedienen van apparatuur als radio en de CD-speler veel genoemd: ook daar steeds minder fysieke knoppen en steeds meer "smart" bediening.

De vraag rijst: hoe kunnen VH hier mee omgaan. De meest gehoorde wens was: een bediening met spraak waarbij zowel de keuze als de terugmelding door middel van spraak gebeuren. Als voorbeeld werd genoemd: je wilt een witte was op 30 graden draaien en dan zou je moeten kunnen zeggen: "wasmachine: doe een witte was op 30 graden" waarna de machine dit zou terug melden als "je wilt een witte was draaien op 30 graden" of je zegt "oven: onder en boven warmte op 220 graden gedurende 30 minuten" waarna de oven dit terugmeldt.

Bij deze wensen werd een tweedeling zichtbaar: een deel van de VH wilde de intelligentie in het apparaat en een deel wilde die functionaliteit op een apart apparaat en dan bij voorkeur op de smartphone (het viel op dat veel VH een smartphone hebben en de daarop aanwezige TST-functionaliteit intensief gebruiken). Vrij algemeen was de kritiek op de leveranciers: waarom doen zij dat niet? Er is een duidelijke behoefte aan een standaard voor dit soort interfaces.

Een ander verzoek dat velen hadden was het begrijpen van de wereld om hen heen (zeer breed), maar dan vooral van de bedieningsknopjes van de apparaten waar ze gebruik van maken. Een vrouw vertelde dat ze bij haar dochter gaat babysitten en dan koffie wil zetten, maar ze kent het apparaat niet. Ze zou graag haar smartphone voor het apparaat willen houden waarna de smartphone de te gebruiken knopjes zou voorlezen. Idealiter zou je dan je vinger boven een knopje houden waarop jouw apparaat dan zou zeggen: "latte macchiato" oid.

Internet en ICT
Bij Internet en meer algemeen ICT was de wens vooral om beter en slimmer te kunnen zoeken en veel diensten ook met spraak te kunnen gebruiken. In toenemende mate worden websites voorleesbaar gemaakt en dat werd gewaardeerd hoewel er kritiek was op de wijze van voorlezen. Het bedienen (doe dit of dat) van de computer/tablet met je stem is echter minder gebruikelijk.

Mobiliteit
Het spreekt voor zich dat VH grote moeite kunnen hebben wanneer ze zich buiten de voor hen vertrouwde omgeving moeten begeven. Veel wensen gingen dan ook over nauwkeuriger navigatiesystemen die je van deurklink tot deurklink kunnen leiden. Ook hier de wens de bediening via spraak te doen. Dit kan in veel gevallen al maar is dikwijls voor verbetering vatbaar. Behalve het navigeren (zeg maar de TomTom-functionaliteit) wilde men ook graag auditieve terugmelding over de plek waar men was ("u bent nu op het kruispunt met X en Y of u passeerde net de Z-straat").

Spraaktech
De huidige stand van de spraakherkenning al redelijk goed. Zowel Apple, Google als Microsoft bouwen reeds spraakherkenning in hun besturingssystemen in. Met apps als SIRI, GoogleVoice en Cotona kun je al veel zaken met je stem doen. Het probleem hierbij is dat de dialogen nu bijna allemaal nog visueel-auditief zijn. Dat wil zeggen, je zegt in Google "hoe laat gaat albert heijn open" en Google komt terug met de zoekopdracht "hoe laat gaat albert heijn open" en toont direct de antwoorden op die zoekopdracht. Dit werkt zeer goed, maar je hebt er niets aan als de resultaten niet worden uitgesproken. Bovendien wil je geen lijst met mogelijke websites maar een (voorgelezen) antwoord. Hetzelfde geldt voor de bediening van apparaten.

Protocollen
Wat hier gedaan moet worden is de koppeling van de herkenningsresultaten aan de besturing van de apparaten. De vraag is hoe. De startup Homey heeft een apparaat ontwikkeld waarbij de spraakherkenning van Google gebruikt wordt om verschillende apparaten in huis te bedienen (Thermostaat, radio-TV e.a.). Het grootste probleem bij het bedienen van apparaten is niet de herkenning, maar het gebrek aan standaardisering van de interfaces. Op dit moment worden er verschillende protocollen gebruikt die niet onderling uitwisselbaar zijn. Bovendien komen Microsoft, Apple en Google ook met hun eigen domotica-protocollen. Zolang er geen algemeen bruikbare standaard komt (zoals html voor websites) is het lastig een generieke manier te ontwikkelen om apparaten met spraak te bedienen. Om deze ontwikkelingen bij fabrikanten in gang te zetten zal het nodig zijn hen ervan te overtuigen dat spraakinterfaces voor iedereen een toegevoegde waarde hebben en niet alleen voor VH.

Conclusie
De bijeenkomst was succesvol en de opkomst was hoog. Ook werd duidelijk dat veel VH de aanwezige TST op hun smartphones al gebruiken. Het gebruik van TST beperkt zich nog vooral tot het verkrijgen van informatie. Het bedienen van apparaten door middel van je stem is echter nog niet goed mogelijk doordat er geen algemene koppeling is tussen een gesproken en goed herkend commando en een daadwerkelijke uitvoering.

De beste vervolgstappen zijn het bij elkaar brengen van bedrijven, universiteiten en VH-organisaties om te zien hoe het gebrek aan standaardisering aangepakt kan worden. Bijvoorbeeld door dit onder de aandacht brengen van leveranciers en het bevorderen van uitwisselingsprotocollen waarmee de verschillende apparaten en diensten onderling kunnen communiceren. Het grootste probleem ligt echter bij de fabrikanten van (huishoudelijke) apparaten: die moeten toestaan dat "vreemde" protocollen gebruikt worden om hun apparaat te bedienen. De Taalunie kan een rol spelen van betekenis om de verschillende partijen bij elkaar te brengen om samen geschikte oplossingen te vinden.

Nieuwsarchief


2017: 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1
2016: 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1
2015: 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1
2014: 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1
2013: 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1
2012: 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1
2011: 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1
2010: 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1
2009: 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1
2008: 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1
2007: 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1
2006: 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1
2005: 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1
2004: 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1
2003: 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1
2002: 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1
2001: 12 | 11 | 10 | 9 | 8 | 6 | 5 | 4 | 3
2000: 10 | 7 | 6 | 5 | 4 | 3 | 2 | 1
0: 0