Documentherkenning is een van de belangrijkste functies binnen Basecone. Het doel hiervan is om automatisch de juiste velden op een document te identificeren, zodat deze informatie gebruikt kan worden bij het boeken van een factuur. Basecone maakt hiervoor gebruik van hybride herkenning, waarbij ingebouwde algoritmen gecombineerd worden met kunstmatige intelligentie (AI).
Onderstaande uitleg beschrijft hoe deze herkenning werkt, hoe Machine Learning wordt toegepast en welke factoren invloed hebben op de nauwkeurigheid.
Hoe werkt documentherkenning?
Hybride herkenning
Basecone gebruikt een combinatie van:
Statische logica: vooraf ingestelde herkenningsregels en algoritmen.
AI‑modellen (Machine Learning): slim getrainde systemen die patronen leren herkennen op basis van voorbeelddata.
Deze twee onderdelen samen vormen de hybride herkenning, die doorgaans betere resultaten levert dan uitsluitend statische herkenning.
Machine Learning: hoe het werkt
1. Gebruik van voorbeelddata
Om Machine Learning toe te passen, is gelabelde voorbeelddata nodig.
Dit betekent dat:
Documenten handmatig worden voorzien van labels (bijv. factuurnummer, datum, totaalbedrag).
Basecone dus exact weet welke velden zich waar op dat document bevinden.
Deze voorbeelden gebruikt worden om nieuwe, binnenkomende documenten te herkennen en te voorspellen.
Ons eerste AI‑model is getraind met 1 miljoen gelabelde documenten, wat een sterke basis vormt.
2. Wat de AI herkent
Het AI‑model kijkt niet alleen naar de tekstwaarden op een document, maar ook naar:
De lay-out van het document.
De posities van velden.
Herkenbare patronen in opmaak en structuur.
Dit verhoogt de kans op juiste herkenning, zelfs bij documenten waarvan de inhoud iets afwijkt.
Doorlopende verbetering door klantdata
Automatisch leren van correcties
Basecone wordt continu slimmer dankzij interacties van gebruikers.
Wanneer een gebruiker een veld corrigeert, leert het systeem:
Welk veld eigenlijk herkend had moeten worden.
Welke afwijkingen of uitzonderingen vaker voorkomen.
Op deze manier verbetert het model zichzelf automatisch.
Veiligheidschecks op uitschieters
Basecone controleert automatisch:
Onlogische of uitzonderlijk hoge bedragen.
Onvolledige of onlogische boekingsinformatie.
Deze veiligheidschecks voorkomen dat afwijkende gegevens automatisch worden geboekt.
Grenzen van nauwkeurigheid
Hoewel onze ambitie is om zo dicht mogelijk bij 100% nauwkeurigheid te komen, is dit in de praktijk niet haalbaar. De nauwkeurigheid hangt namelijk af van factoren zoals:
Kwaliteit van het document (bijv. scanresolutie, scheef scannen, onduidelijke tekst).
Grote variatie in factuurlay-outs van verschillende leveranciers.
Datakwaliteit in het aangeleverde document.
Afwijkingen en variaties in AI‑herkenning, zoals ieder Machine Learning‑systeem dat kent.
Hybride herkenning zorgt gemiddeld voor betere resultaten, maar in individuele gevallen kan de herkenning afwijken.
