De ondertitel-bril SpraakZien – hocus pocus, sciencefiction of serieuze wetenschap?

Stel u bent slechthorend, zo slechthorend dat een gehoorapparaat geen optie (meer) is, of wellicht bent u helemaal doof. Slechthorend of doof zijn is een grote handicap, omdat onze samenleving voor een groot deel gebruik maakt van (gesproken) taal voor de informatie-uitwisseling. Deze informatie gaat nu nog voorbij aan slechthorenden of doven. Maar het bedrijf Oorzaak heeft een innovatief hulpmiddel voor mensen met een ernstige gehoorbeperking  ontwikkeld, dat in samenwerking met de Universiteit Leiden, in het bijzonder het Leiden University Center for Linguistics (LUCL) en het Leiden Institute for Brain and Cognition (LIBC), getoetst en verder verbeterd wordt.  

Het hulpmiddel heeft de naam SpraakZien en het werkt als volgt: de slechthorende of dove persoon draagt een speciale videobril, uitgerust met een microfoon die het spraakgeluid van een gesprekspartner opvangt. Dit signaal wordt via een draadloze verbinding naar spraakherkenningssoftware gestuurd die op een laptop draait. Denkbaar is dat dit in de toekomst middels een “app” op een smartphone gebeurt. Het herkende spraaksignaal wordt direct omgezet naar tekst en teruggestuurd naar de videobril, waar de tekst in de bril geprojecteerd wordt. De drager van de bril kan zo lezen wat er gezegd werd zonder het oogcontact met de communicatiepartner te onderbreken (zie ook figuur). De eerste proeven met plotsdoven hebben laten zien dat de verstaanbaarheid van spraak significant verbeterd wordt, zowel op niveau van losse woorden als bij het begrijpen van zinnen.

Dat klinkt fantastisch, is zeker geen hocus pocus en ook geen sciencefiction. Maar er moet nu nog veel gebeuren voordat de ondertitel-bril op de markt kan komen en daarvoor is serieus wetenschappelijk werk nodig. Zo is achtergrondgeluid bijvoorbeeld problematisch, omdat daardoor de signaal-ruisverhouding kleiner wordt en daarmee de correcte herkenning van spraak. Verder vereist de spraakherkenningssoftware op dit moment nog een korte trainingsfase, zodat de software zich op een nieuwe spreker kan instellen. Verder lezen we (ondertitels) langzamer dan dat we spreken, wat betekent dat in het conversieproces van spraak naar tekst een reductie moet worden toegepast. Echter, hoe moet het systeem weten wat er wel en niet mag worden weggelaten?

We hebben natuurlijk ook veelbelovende ideeën voor de verdere ontwikkeling van de bril, zoals een terugkoppeling naar de spreker. Deze kan zien of de spraak duidelijk en niet te snel is, en een automatisch gezichtsherkenningssysteem (commercieel verkrijgbaar) waarmee een spreker herkend wordt en zijn bekende “sprekerprofiel” opgehaald kan worden. Ook valt te denken aan een vertaalcomponent waardoor de bril ook voor normaal horenden interessant zou kunnen worden. 

Uit onderzoek blijkt duidelijk dat doven zeer positief staan tegenover de ontwikkeling van een SpraakZien-bril.