Waarom AI steeds beter wordt in het lezen van oud handschrift

Nog niet zo lang geleden gold handgeschreven tekst als iets waar computers vrijwel niets mee konden. Tekstherkenning werkte prima bij ...

Nog niet zo lang geleden gold handgeschreven tekst als iets waar computers vrijwel niets mee konden. Tekstherkenning werkte prima bij gedrukte letters, maar zodra iemand met de hand had geschreven, hield het al snel op. Wie tien jaar geleden geprobeerd heeft een oude brief automatisch te laten herkennen, herinnert zich waarschijnlijk nog de teleurstellende resultaten. Inmiddels is dat beeld flink achterhaald, en de vooruitgang gaat nog altijd door.

Van vaste regels naar zelflerende modellen

Vroege pogingen tot tekstherkenning werkten met vaste regels: een systeem kreeg te horen hoe een letter A of een letter B er ongeveer uitzag, en probeerde daaraan gescande tekens te matchen. Bij handschrift werkte dat nauwelijks, omdat de variatie simpelweg te groot is. De doorbraak kwam met zelflerende modellen, die niet werken met vaste sjablonen maar patronen leren herkennen uit duizenden echte voorbeelden. Hoe meer voorbeelden een model te zien krijgt, hoe beter het wordt in het interpreteren van net dat beetje afwijkend handschrift dat het nog niet eerder tegenkwam.

Steeds meer historisch materiaal als leermateriaal

Een groot deel van de recente vooruitgang komt voort uit de beschikbaarheid van historisch bronmateriaal. Archieven en bibliotheken stellen steeds vaker gedigitaliseerde collecties beschikbaar, inclusief handmatige transcripties die als leermateriaal dienen. Daardoor kunnen modellen worden getraind op precies het soort documenten waar ze uiteindelijk voor worden ingezet: doopregisters, correspondentie, notariële akten. Software zoals BIQE AI HTR profiteert van deze ontwikkeling en wordt continu bijgewerkt naarmate er meer trainingsmateriaal beschikbaar komt, wat direct te merken is aan de kwaliteit van de resultaten.

Wat betekent dit voor de praktijk

Voor gebruikers vertaalt deze vooruitgang zich in minder handmatige correctie. Waar een paar jaar geleden nog gold dat elk resultaat zorgvuldig nagekeken moest worden, is de foutmarge inmiddels bij veel documenttypen aanzienlijk kleiner geworden. Dat betekent niet dat controle overbodig is, zeker niet bij bijzonder lastig materiaal, maar het scheelt aanzienlijk in de tijd die nodig is om een collectie volledig te doorzoeken.

De vooruitgang in handschriftherkenning is dus geen toevalstreffer, maar het resultaat van steeds slimmere modellen en steeds meer beschikbaar trainingsmateriaal. En omdat beide ontwikkelingen doorgaan, ligt het voor de hand dat ook het lastigste handschrift van vandaag over een paar jaar een stuk minder problematisch zal blijken.

https://ocr-handwriting.com/nl/

Gerelateerde berichten die u niet mag missen

Meubels

Complete tafels voor jarenlang woonplezier

Complete tafels voor jarenlang woonplezier Bij het inrichten van een huis zijn complete tafels een essentieel element voor gezelligheid en functionaliteit. Of u nu dineert