Naar de hoofdinhoud

Documentherkenning in Basecone

In dit artikel leggen we je uit hoe herkenning in Basecone werkt en wat jij kunt doen om dit te verbeteren.

Geschreven door Debora Heg-Jobsen
Gisteren bijgewerkt

Documentherkenning is een van de belangrijkste functies binnen Basecone. Het doel hiervan is om automatisch de juiste velden op een document te identificeren, zodat deze informatie gebruikt kan worden bij het boeken van een factuur. Basecone maakt hiervoor gebruik van hybride herkenning, waarbij ingebouwde algoritmen gecombineerd worden met kunstmatige intelligentie (AI).

Onderstaande uitleg beschrijft hoe deze herkenning werkt, hoe Machine Learning wordt toegepast en welke factoren invloed hebben op de nauwkeurigheid.


Hoe werkt documentherkenning?

Hybride herkenning

Basecone gebruikt een combinatie van:

  • Statische logica: vooraf ingestelde herkenningsregels en algoritmen.

  • AI‑modellen (Machine Learning): slim getrainde systemen die patronen leren herkennen op basis van voorbeelddata.

Deze twee onderdelen samen vormen de hybride herkenning, die doorgaans betere resultaten levert dan uitsluitend statische herkenning.


Machine Learning: hoe het werkt

1. Gebruik van voorbeelddata

Om Machine Learning toe te passen, is gelabelde voorbeelddata nodig.
Dit betekent dat:

  • Documenten handmatig worden voorzien van labels (bijv. factuurnummer, datum, totaalbedrag).

  • Basecone dus exact weet welke velden zich waar op dat document bevinden.

  • Deze voorbeelden gebruikt worden om nieuwe, binnenkomende documenten te herkennen en te voorspellen.

Ons eerste AI‑model is getraind met 1 miljoen gelabelde documenten, wat een sterke basis vormt.

2. Wat de AI herkent

Het AI‑model kijkt niet alleen naar de tekstwaarden op een document, maar ook naar:

  • De lay-out van het document.

  • De posities van velden.

  • Herkenbare patronen in opmaak en structuur.

Dit verhoogt de kans op juiste herkenning, zelfs bij documenten waarvan de inhoud iets afwijkt.


Doorlopende verbetering door klantdata

Automatisch leren van correcties

Basecone wordt continu slimmer dankzij interacties van gebruikers.
Wanneer een gebruiker een veld corrigeert, leert het systeem:

  • Welk veld eigenlijk herkend had moeten worden.

  • Welke afwijkingen of uitzonderingen vaker voorkomen.

Op deze manier verbetert het model zichzelf automatisch.

Veiligheidschecks op uitschieters

Basecone controleert automatisch:

  • Onlogische of uitzonderlijk hoge bedragen.

  • Onvolledige of onlogische boekingsinformatie.

Deze veiligheidschecks voorkomen dat afwijkende gegevens automatisch worden geboekt.


Grenzen van nauwkeurigheid

Hoewel onze ambitie is om zo dicht mogelijk bij 100% nauwkeurigheid te komen, is dit in de praktijk niet haalbaar. De nauwkeurigheid hangt namelijk af van factoren zoals:

  • Kwaliteit van het document (bijv. scanresolutie, scheef scannen, onduidelijke tekst).

  • Grote variatie in factuurlay-outs van verschillende leveranciers.

  • Datakwaliteit in het aangeleverde document.

  • Afwijkingen en variaties in AI‑herkenning, zoals ieder Machine Learning‑systeem dat kent.

Hybride herkenning zorgt gemiddeld voor betere resultaten, maar in individuele gevallen kan de herkenning afwijken.

Was dit een antwoord op uw vraag?