Heuristisch vertalen

Een boek lees je bij voorkeur in de taal waarin het werd geschreven. Iedere vertaling – hoe goed de vertaler ook was – is een nieuwe generatie in het leven van een boek.

Ook twee mensen die verschillende talen spreken, kunnen grote moeite hebben om elkaar foutloos en zonder verlies van nuance te begrijpen. En op dit moment zijn ook computers nog steeds niet in staat om literaire teksten uit een bepaalde taal foutloos om te zetten naar een andere. En niet alleen foutloos, maar ook met hetzelfde gevoel er in. Hetzelfde venijn, de vergelijkbare ondertoon, de subtiele volgorde. 'De mens alleen, alleen de mens', benoem maar eens de regel die dit verschil in betekenis verklaart. De grammatica van een taal is misschien nog te bevatten, maar de uitzonderingen en afwijkingen zijn talrijk.

Maar dachten we dat ook niet altijd van het schaakspel? De schaakregels zijn niet extreem moeilijk, maar de volgorde van zetten en de combinatie van stukken maakt het spel zo ingenieus. Het is niet zo ingewikkeld om een computer foutloos te laten schaken. Een computer laten winnen was dat wél, zo bleek lange tijd. Maar de hersencapaciteit van de mens is ongeveer gelijk gebleven, terwijl die van de computer spectaculair is toegenomen.

En toen kwam er een moment dat de computer opgedragen werd om het schaakspel niet zozeer syntactisch en intelligent te benaderen maar veeleer met brute rekenkracht. Bereken lompweg alle mogelijke stellingen die kunnen voortvloeien uit de huidige stelling. En niet na één zet, niet na twee, maar tien of twintig zetten diep. Strikt theoretisch zou een computer na de openingszet al de triljarden verschillende mogelijke eindstellingen kunnen benoemen. Bobby Fisher werd ooit gevraagd of hij ook van God zou kunnen winnen. 'Wel als ik met wit speel', antwoordde hij.

Hetzelfde spel wordt nu gespeeld met het vertalen. Laat de regels de regels, de syntax de syntax en de grammatica de grammatica, maar ga puur uit van wat reeds en met succes vertaald werd. Boeken, documenten, verslagen van de VN of van Brussel (Bruxelles) of Straatsburg (Strassbourg). Als je duizenden geaccepteerde vertalingen aan een computer aanbiedt, zal hij op een gegeven moment in staat zijn zijn eigen ervaringsregels te maken. Een bepaalde woordcombinatie levert altijd die ene vertaling op, een zekere zinsconstructie leidt altijd tot datzelfde resultaat. De oliedomme maar o zo imposante kracht wordt ingezet om een prachtig taalconstruct van de mens mechanisch om te zetten naar een andere taal. De computer begrijpt er helemaal niets van. Het is als een meestervervalser die vierkante centimeter per vierkante centimeter van een groot schilderij kopieert zonder te weten of het de Nachtwacht of Guernica was.

Er is ruim onderzoeksmateriaal voor de heuristische taalvreter. Als een zinnenspotter neemt hij plaats aan de paden waarlangs de Wikipedia's bewegen, waar de Googles hun gedigitaliseerde boeken langs sturen. Aan opslagruimte is geen gebrek. 'Monnikenwerk', zouden we vroeger zeggen. Aangezien er steeds minder monniken tot onze beschikking staan mogen we de computers dankbaar zijn dat ze het werk overnemen. En dat ze dat op hun manier doen, is ook weer te begrijpen. Het voelt alleen zo schraal aan.

JOOST STEINS BISSCHOP

Copyright (c) 2006 Het Financieele Dagblad

Reageer op dit artikel

Zorg er voor dat je de vereiste* informatie invult, waar aangegeven.

validate: 032499332

Schrijf je nu in voor onze nieuwsbrief!

Altijd op de hoogte van de trends, tips & actualiteiten

Je kunt ons bereiken:

Weesperstraat 81
1018 VN Amsterdam
020 - 514 14 14
› Neem contact op
› Onze vacatures

Volg ons op:

› Twitter
› Facebook
› Google+
› LinkedIn