Technologie die ambtelijke taal herschrijft
Een computer die ‘Barack Obama’ aangeeft als je ‘president van de Verenigde Staten’ typt? Deze vertaaltechnologie is mogelijk volgens Sander Wubben, promovendus aan de Universiteit van Tilburg. De technologie kan twittertaal of ambtelijke taal ook omzetten in bruikbaar Nederlands.
De technologie wordt vaak gebruikt voor vertalingen, maar is volgens Wubben ook bruikbaar voor herschrijving binnen een taal. De suggestiemethode kan zinsdelen vervangen, automatisch parafraseren en teksten samenvatten, versimpelen of moderniseren. Zo liet Wubben de computer het Middelnederlands verhaal ‘Van den Vos Reynaerde’ herschrijven.
Wubben verzamelde en onderzocht miljoenen nieuwskoppen. Hij ontdekte dat computermodellen kunnen leren van de verschillen in nieuwsberichten die schrijven over dezelfde gebeurtenis. De techniek is naast een handigheid ook een hulpmiddel voor mensen die moeite hebben met het verwerken van de Nederlandse taal, zoals mensen met dyslexie.
Het proefschrift van Sander Wubben heet: “Text-to-text generation by monolingual machine translation.” Wubben promoveert 5 juni om 16.15 uur in de aula van de universiteit.