Een Chinese start-up toont een nieuw model dat gebarentaal kan omzetten naar tekst, en tekst naar gebaren. Het systeem gebruikt een camera om handvormen, gezichtsuitdrukking en lichaamshouding te lezen. Daarna maakt het met algoritmen een begrijpelijke zin of een gebarende avatar. De belofte: minder drempels in gesprekken tussen dove en horende mensen, ook online en aan de balie.
Van gebaren naar tekst en terug
Het model werkt in twee richtingen. Eerst herkent het korte videobeelden van gebaren en zet die om naar woorden en zinnen. Daarna kan het ook tekst teruggeven als een reeks gebaren via een digitale avatar. Zo ontstaat een gesprek zonder tolk, met de camera als invoer en een scherm als uitvoer.
Technisch bestaat dit uit twee stappen. Een herkenner āzietā bewegingen en handposities. Een taalmodule maakt er een correcte zin van. Voor de andere kant gebruikt het systeem een avatar die gebaren nauwkeurig moet tonen, inclusief mimiek, want dat draagt betekenis.
De kern blijft nauwkeurigheid en timing. Het systeem moet snel zijn, zodat een gesprek niet stroef wordt. Ook kleine fouten hebben impact, want ƩƩn misplaatst gebaar kan de betekenis veranderen. Dit vraagt om veel testwerk in echte situaties.
Gebarentalen verschillen sterk
Gebarentaal is niet universeel. Nederlandse Gebarentaal (NGT) verschilt van Amerikaanse en Chinese varianten in woordvolgorde, woordenschat en mimiek. Een model dat traint op ƩƩn taal, werkt dus niet automatisch voor een andere.
Op het moment van schrijven is niet duidelijk of dit nieuwe systeem Europese gebarentalen ondersteunt. Waarschijnlijk is het vooral getraind op data uit China. Dat maakt lokalisatie nodig: aanpassen aan NGT, VGT (Vlaamse Gebarentaal) en andere Europese talen.
Die stap vraagt samenwerking met dove gemeenschappen. Woordenlijsten en grammatica moeten kloppen. Regionale varianten, context en culturele nuances zijn belangrijk. Zonder die input wordt de vertaling snel te vlak of zelfs fout.
Datakwaliteit bepaalt betrouwbaarheid
Algoritmen leren van voorbeelden. Voor gebarentaal betekent dat: veel videoās met goede labels, opgenomen vanuit verschillende hoeken en met diverse gebaarders. Zulke datasets zijn schaars en duur om te maken. Daardoor ontstaat het risico dat systemen vooral goed werken in studio-omstandigheden.
Voor echte inzet zijn lastige plekken juist cruciaal: loketten, klaslokalen, ziekenhuizen en treinstations. Daar is licht wisselend, achtergrond druk, en is er soms mondkapjes of handschoenen. Een robuust model moet daarmee omgaan zonder de betekenis te verliezen.
Transparantie helpt. Wie heeft het trainingsmateriaal geleverd? Hoe is toestemming geregeld? En hoe scoort het systeem op precisie, vertraging en foutsoorten? Heldere, vergelijkbare meetcijfers zijn nodig om systemen eerlijk te kunnen beoordelen.
Privacy en Europese regels wegen mee
Cameraās filmen personen en hun taal. Dat valt in Europa onder de AVG. Organisaties moeten daarom dataminimalisatie toepassen, beelden versleutelen en liefst op het apparaat verwerken. Opslag in de cloud vraagt extra bescherming en duidelijke toestemming.
De Europese AI-verordening zet ook kaders. Als zoān vertaler wordt gebruikt in overheidsdiensten, onderwijs of zorg, kan de toepassing onder strengere regels vallen. Dan zijn risicoanalyses, menselijk toezicht en duidelijke gebruikersinformatie verplicht.
De timing is relevant voor Nederland. De Wet erkenning Nederlandse Gebarentaal geldt al, en de Europese Toegankelijkheidsakte treedt in 2025 in werking. Dat maakt vraag naar bruikbare, veilige hulpmiddelen groter, maar ook de lat voor kwaliteit en privacy hoger.
Kansen voor Nederland en Europa
Europa investeert in vertaaltechnologie voor gebarentalen, onder meer via projecten als SignON en EASIER. Universiteiten en start-ups werken hier samen met dove communities. Dit Chinese initiatief kan de vaart erin houden, maar moet wel passen bij Europese standaarden en talen.
Voor Nederlandse instellingen liggen toepassingen voor de hand. Denk aan klantenservice, onderwijs en openbare dienstverlening. Een eerste stap kan zijn: pilots met NGT, met duidelijke doelen en onafhankelijke evaluatie, en altijd met menselijke back-up.
Praktische eisen zijn duidelijk: lage vertraging, hoge nauwkeurigheid en begrijpelijke uitleg van fouten. Ook moet de avatar gebaren vloeiend tonen en mimiek correct overbrengen. Zonder die elementen voelt de vertaling onnatuurlijk aan en loopt het gesprek vast.
āGebarentaal is een volwaardige taal met eigen grammatica ā ƩƩn āuniverseleā vertaler bestaat niet.ā
- Direct inzetbaar voor korte baliegesprekken
- Ondersteuning in klaslokaal en collegezaal
- Snellere triage in de zorg, met tolk op afroep
- Realtime hulp in OV-apps en ticketautomaten
De komst van een nieuw model is goed nieuws voor toegankelijkheid. Maar succes hangt af van lokale taalondersteuning, datakwaliteit en sterke privacybescherming. Met zorgvuldige pilots en betrokkenheid van dove gebruikers kan deze technologie echt verschil maken.
