Wijdverspreide toepassingen
Machinevertaling en neural networks: de perfecte combi?
Neurale netwerken: het klinkt wellicht als een uitvinding van dit digitale tijdperk, maar stiekem spelen ze al sinds het begin van de mensheid een cruciale rol in alles wat wij doen en laten. Het menselijk brein is namelijk een neuraal netwerk – via neuronen en synapsen kan ons belangrijkste orgaan iedere seconde zo’n 11 miljoen bits aan informatie verwerken. Toch zouden mensen tot zeker halverwege de twintigste eeuw glazig opkijken als ze deze term zouden horen. Dat het begrip hedendaags minder vragende blikken oplevert, komt niet alleen doordat wij inmiddels veel meer weten over de hersenen, maar voornamelijk door een recentere ontwikkeling: kunstmatige neurale netwerken. Deze neurale netwerken hebben wijdverspreide toepassingen, van aandelenkoersen en het verloop van pandemieën voorspellen tot het winnen van een spelletje GO. Ook in de vertaalwereld zijn neurale netwerken inmiddels niet meer weg te denken en spelen ze een essentiële rol bij machinevertaling.
Een stapje terug in de geschiedenis
Van neural network naar machinevertaling
Om de rol van neurale netwerken bij machinevertaling goed te begrijpen, moeten we eerst een stapje terug doen in de geschiedenis en kijken naar wat daarvoor kwam: statistische machinevertaling (SMT). Dit vertaalsysteem is gebaseerd op enorme hoeveelheden vertalingen, ook wel tweetalige corpora genoemd. Aan de hand van deze corpora berekent het systeem de statistische waarschijnlijkheid dat een tekstelement in de brontekst overeenkomt met een element in de doeltekst. Hierdoor ontstaan regels en patronen, die vervolgens toegepast worden om nieuwe zinnen te vertalen. Nadelen van SMT zijn dat het moeite heeft met context en dat er meerdere modellen nodig zijn voor vertalingen, allemaal met een eigen ontwerp en specifieke training.
Een (gedeeltelijke) oplossing voor deze problemen is neural machine translation (NMT). Allereerst is deze variant van machinevertaling een zogenaamd end-to-end systeem, wat inhoudt dat er maar één model nodig is voor vertalingen. Kort gezegd, en zoals de naam al suggereert, maakt NMT gebruik van neurale netwerken om vertalingen te generen. Word embeddings, of woordverzamelingen in de vorm van vectoren zijn hierbij cruciaal. Bij neurale machinevertaling traint een neuraal netwerk op grote hoeveelheden parallelle teksten, waarbij elk woord in de brontaal wordt omgezet in een bijbehorende vector – een reeks getallen die het woord representeert. Door middel van meerdere lagen kunstmatige neuronen, leert het netwerk zichzelf vervolgens om de brontaalvector om te zetten in de doeltaalvector. Deze doeltaalvector wordt weer uitgelezen en voilà, jouw voorheen Nederlandse tekst kan ook in Frankrijk, China of Japan bewonderd worden.
Het self-attention mechanisme
Neural machine translation: zo werkt het
Het omzetten van brontekst naar een vector en het uitlezen van een doeltaalvector om de daadwerkelijke vertaling te genereren is de taak van een encoder-decoder neuraal netwerk – op dit moment de meest gebruikte architectuur voor neurale machinevertaling. Waar de eerste NMT-systemen echter tegenaan liepen is dat langer doorlopende zinnen vaak slecht vertaald werden. Lange-termijn afhankelijkheden, de complexe relaties tussen woorden die niet direct naast elkaar staan, bleken moeilijk te vertalen. Gelukkig is de techwereld constant bezig voor ieder gat een spijker te vinden en is ook voor dit probleem een oplossing bedacht: het self-attention mechanisme.
De mens in het model
Bij het horen van de zin a Lannister always pays his debts denken serieliefhebbers direct aan de enorm populaire fantasyserie Game of Thrones. Dat doen ze niet omdat ze uitvoerig hebben nagedacht over de betekenis van ieder woord in de zin, maar omdat er bij het woord ‘Lannister’ gelijk een lampje is gaan branden. Het self-attention (of attention) mechanisme probeert van deze menselijke slimmigheid gebruik te maken. Met behulp van wiskundige technieken helpt dit mechanisme het NMT-systeem te bepalen welke input het meest relevant is bij het genereren van een antwoord (een vertaling) en welke juist minder. Hierdoor worden langere-termijn afhankelijkheden gemodelleerd en werkt het model sneller, beter en efficiënter.
Wist je dat.?
Vertalen nog nooit zo makkelijk was? Probeer het met ons revolutionaire vertaalplatform.
De vijf voordelen
Voordelen en toepassingen
Een aantal voordelen van machinevertaling, NMT in het bijzonder, zijn al voorbij gekomen maar toch zetten we de belangrijkste nog even voor jou op een rijtje:
- Nauwkeurigheid: Onderzoek heeft aangetoond dat NMT-systemen zoals Google Translate menselijke vertalers heel dicht naderen bij veel voorkomende (Europese) talenparen – denk Engels-Duits en Engels-Spaans. Bovendien heeft deze variant van machinevertaling het vermogen om mettertijd te ‘leren’ en worden de vertalingen dus alsmaar beter. Waar SMT-systemen voorheen nog veel moeite hadden met context en zinnen in losse segmenten opgedeeld werden, werkt NMT op zinsniveau en wordt context steeds beter meegenomen.
- Toegankelijkheid: Mits je een internetverbinding hebt is machinevertaling voor iedereen toegankelijk. En dan bedoelen we ook echt (bijna) iedereen. Google Translate biedt ruim honderd verschillende talen aan en bij DeepL heb je de keuze uit wel 800 talencombinaties.
- Snelheid: Een professioneel vertaler levert per dag gemiddeld 2000 woorden op, een vertaalmachine doet hier minder dan een minuut over. Bij een serieuze spoedklus kan een machinevertaling dan ook dé uitweg zijn voor jouw project.
- Prijs: Veel vertaalmachines zijn gratis te gebruiken. Ook bij een klein budget ligt een vertaling dus binnen handbereik.
- Specialisatie: De eigenschappen van neurale netwerken maken NMT-systemen zeer geschikt voor het ontwerp van modellen specifiek voor vakgebieden met een eigen jargon, bijvoorbeeld voor de medische of juridische wereld.
Perfect voor e-commerce
NMT is met name een handig hulpmiddel in de e-commerce wereld. In een online speelveld dat de hele wereld bestrijkt, willen bedrijven zo veel mogelijk mensen bereiken en dus hun website naar een groot aantal talen vertalen. Want: hoe meer klanten, hoe meer inkomsten. Maar NMT is niet alleen een manier om op een kostenefficiënte manier het klantenbestand te vergroten, het helpt ook bij het verbeteren van de klantenervaring. Met behulp van machinevertaling hebben bedrijven in een handomdraai de feedback en recensies van hun klanten vertaald. Zo wordt het verbeteren van producten en diensten een stuk eenvoudiger en zorgen bedrijven niet alleen voor nieuwe doelgroep, maar ook voor tevreden klanten.
Het beste van twee werelden
Post-editing is (nog steeds) key
Toch vertrouwen de meeste e-commerce bedrijven nog niet honderd procent op machinevertaling. Die perfecte merkslogan mét woordspeling waar jij weken over hebt zitten wikken en wegen, verliest vaak zijn creativiteit als jij hem door een programma als Google Translate laat vertalen. Een professioneel vertaler daarentegen weet hier wel raad mee.
Soms is de gulden middenweg echter de uitkomst en in dit geval betekent dat post-editing. Een taalspecialist, de post-editor, verbetert een tekst die door een machine is vertaald. Zo combineer jij de snelheid en lage kosten van een machinevertaling met de kwaliteit van een professionele vertaler. Post-editing kan een heel geschikte oplossing zijn voor teksten die door de machine redelijk acceptabel vertaald zijn maar waarvan de zoekwoorden nog geoptimaliseerd moeten worden. Ook is post-editing een goede optie voor teksten die regelmatig opnieuw moeten worden vertaald, denk aan jaarverslagen of gebruikershandleidingen. Een vertaalmachine kan hier goed mee uit de voeten en een post-editor controleert de teksten om translation fails te voorkomen.
Let wel op dat post-editing jou niet meer moeite kost dan het waard is. Bij teksten met meerdere verhaallijnen of een specifieke doelgroep laat een vertaalmachine weinig heel van de originele tekst. Dan kost het herstelwerk zo veel tijd dat het inschakelen van een vertaler een betere keuze is.
Simpel, maar revolutionair.
Simply Translate is dé plek voor jouw machinevertaling
Ben jij op zoek naar kostenefficiënte vertalingen en wil jij daarvoor de beste technologie gebruiken? Dan ben je bij Simply Translate aan het juiste adres! Met behulp van ons geavanceerde platform regelen wij automatisch inkomende vertaalverzoeken, zorgen ervoor dat van jouw content een werkbaar bestand wordt gemaakt en leveren vervolgens een geautomatiseerde vertaling. Uiteraard kun je ook voor post-editing kiezen, dan schakelen wij een van onze native vertalers in voordat we de vertaling overdragen.
Wil je meer weten over onze machinevertaling, post-editing of de mogelijkheid om eigen datasets te trainen? Neem dan snel contact met ons op of kom gezellig langs voor een kop koffie!