Onderzoekers ontwikkelden HATL, een adaptief leerframework dat de vertaling van gebarentaal naar tekst significant verbetert door slim gebruik van voorgetrainde AI-modellen.

Onderzoekers hebben een nieuwe AI-methode ontwikkeld die de automatische vertaling van gebarentaal naar tekst drastisch verbetert. Het Hierarchical Adaptive Transfer Learning (HATL) framework behaalde verbeteringen tot 37,6% ten opzichte van traditionele methoden.
Gebarentaal Machine Translation (SLMT) heeft als doel de communicatie tussen dove en horende mensen te verbeteren. Echter, de vooruitgang wordt belemmerd door verschillende uitdagingen:
Bestaande transfer learning-methoden zijn statisch en leiden vaak tot overfitting, waarbij het model te specifiek wordt getraind op beperkte data.
Het nieuwe HATL-framework lost deze problemen op door een hiërarchische en adaptieve aanpak:
Dynamisch ontdooien van lagen: In plaats van alle voorgetrainde lagen tegelijk aan te passen, worden ze progressief en dynamisch 'ontdooid' op basis van trainingsprestaties.
Laaggewijze leersnelheid: Verschillende lagen krijgen verschillende leersnelheden, waarbij diepere lagen langzamer worden aangepast.
Stabiliteitsmechanismen: Het framework behoudt generieke representaties terwijl het zich aanpast aan specifieke gebarenkenmerken.
De onderzoekers gebruikten een ST-GCN++ backbone voor feature-extractie en Transformer-modellen voor de daadwerkelijke vertaling. Ze testten ook een adaptieve transformer (ADAT) variant.
Het systeem werd geëvalueerd op twee hoofdtaken:
HATL werd getest op drie verschillende datasets:
De BLEU-4 score is een standaardmaatstaf voor vertaalkwaliteit, waarbij hogere scores betere vertalingen betekenen.
Een belangrijk aspect van het onderzoek was het testen van robuuste meertalige generalisatie. HATL presteerde consistent beter dan traditionele transfer learning-methoden over verschillende taken en modellen heen.
Deze doorbraak heeft belangrijke implicaties voor toegankelijkheidstechnologie. Betere automatische gebarentaalvertaling kan:
Het HATL-framework toont aan dat adaptieve, hiërarchische benaderingen veelbelovend zijn voor het overbruggen van domeinverschillen in AI-toepassingen, niet alleen voor gebarentaalvertaling maar mogelijk ook voor andere gebieden met beperkte data.

Nieuw AI-systeem voorspelt minimaal benodigde beeldresolutie voor visuele taalmodellen, wat tot 80% minder rekenkracht kan opleveren.

Nieuwe techniek gebruikt superklassen om AI-modellen robuuster te maken tegen misleidende patronen zonder handmatige labels.

Nieuw onderzoek toont aan dat de structuur van woordenschat crucialer is dan vrije woordvolgorde voor hoe AI-modellen talen leren.