Kies je favoriete radiostation

Dossiers

Technologie vervangt journalisten

Medianieuws

De computer kan leren tekst te herschrijven door bronnen zoals nieuwskoppen te analyseren. Afhankelijk van de bron kan de computer ingezet worden om tekst automatisch toegankelijker te maken. Dat stelt onderzoeker Sander Wubben van de Universiteit Tilburg. Wubben promoveert met dit bijzondere onderzoek op 5 juni.

Dit is mogelijk door het proces te beschouwen als een vertaaltaak binnen een taal, waarbij de computer leert van voorbeelden. Voor zijn onderzoek paste Wubben automatische vertaaltechnologie toe op taken als het automatisch parafraseren, versimpelen, samenvatten en moderniseren van taal.

Deze technologie wordt normaliter gebruikt voor het automatisch vertalen tussen talen (zoals bijvoorbeeld in Google Translate), maar is dus ook toepasbaar op herschrijftaken binnen een taal.

Miljoenen nieuwskoppen
Wubben verzamelde Wubben miljoenen nieuwskoppen en ontdekte dat computermodellen kunnen leren van de variatie die optreedt in verschillende nieuwskoppen als meerdere kranten een nieuwsbericht schrijven over een bepaalde gebeurtenis. De computer leert op deze manier niet alleen synoniemen, maar ook hoe zinsdelen kunnen worden vervangen door andere zinsdelen. Zo leert de computer bijvoorbeeld dat ‘De president van de Verenigde Staten’  kan worden vervangen door "Barack Obama".

Een andere taak waarvoor de computer kan worden ingezet is het automatisch simpeler maken van een tekst. Voor deze taak leerde de computer van de online encyclopedie Wikipedia. Van die encyclopedie bestaat een versimpelde variant, Simple Wikipedia. Door artikelen in de originele variant te vergelijken met de simpele variant kan de computer leren hoe je zinnen kunt versimpelen.

Ook onderzocht Wubben het automatisch moderniseren van Middelnederlandse tekst door de computer te laten kijken naar moderne vertalingen van teksten zoals het verhaal 'Van den Vos Reynaerde'.

Hulpmiddel voor mensen met dyslexie
De door Wubben onderzochte technieken kennen veel potentiële toepassingen. Zo kan de computer bijvoorbeeld ingezet worden als hulpmiddel voor mensen die een taal nog niet geheel beheersen, of die moeite hebben met het verwerken van taal, zoals mensen met dyslexie.

Sms- of twittertaal
Ook kan de computer worden gebruikt om bijvoorbeeld sms- of twittertaal of zelfs ambtelijke taal om te zetten in 'normale' taal en vice versa. Een andere mogelijke toepassing is als schrijfhulp, waarbij de computer vergelijkbaar met een spellingscorrector werkt, maar dan let op stijl en suggesties kan doen om beter gevormde tekst te schrijven.

Sander Wubben volgde de studie Communication and Information Sciences aan Tilburg University met als specialisatie Human Aspect of Information Technology. Momenteel is hij werkzaam als universitair docent aan Tilburg University. Wubben promoveert hiermee op 5 juni. [Radio.NL]

Gerelateerde Artikelen