De Smart Document Analyzer analyseert documenten, classificeert ze en haalt er een veelheid aan gegevens uit. Door slimme toepassing van kunstmatige intelligentie en machine learning doet de Analyzer dat werk steeds slimmer en beter.
Compliancy
De Smart Document Analyzer helpt u bij actieve openbaarmaking van overheidsinformatie volgens de Wet open overheid (Woo), de vervanger van de Wet openbaarheid van bestuur (Wob). Bestuursorganen moeten bepaalde categorieën informatie verplicht actief openbaar maken via het Platform Open Overheidsinformatie (PLOOI). Daarbij gelden twee belangrijke aandachtspunten: het document moet voorzien zijn van de bedoelde metadata én het document moet geanonimiseerd zijn, oftewel ontdaan zijn van gevoelige informatie. De SDA zoekt en vindt metadata in en over het document, de SPA zoekt en behandelt gevoelige informatie.
Basisfuncties
De Smart Document Analyzer voorziet in hoofdzaak in de volgende functies:
- Documenten laten typeren volgens het voor uw organisatie geldende document structuur plan of een andere classificatie;
- Documenten voorzien van aanvullende relevante contextuele metadata die ten tijde van het opstellen of ontvangen van het document nog niet beschikbaar of relevant waren;
Lerend karakter
De Smart Document Analyzer leert steeds bij. Dat gebeurt in twee stappen. Bij initiële installatie traint GlobeScope het model voor de bij u geldende documenttypen. Daarmee haalt u snel al zeer behoorlijke scores. In de gebruiksfase nemen uw medewerkers het over. Zo verfijnen zij het resultaat en trainen wij het model verder op het beter herkennen van documenttypen en vinden van de juiste metadata.
Werkwijze
Met de Smart Document Analyzer kunt u een digitaal document herkennen als een bepaald type.
- Via een webinterface waarbij de gebruiker één of een set van meerdere digitale documenten aanbiedt;
- Via een webservice waardoor integratie met uw eigen systemen mogelijk is (voor bijvoorbeeld koppeling op binnenkomende digitale post of als slimme vervolgstap aan het einde van de scanstraat).
Vervolgens kan de Smart Document Analyzer het gevonden documenttype en de relevante contextinformatie:
- Via een webinterface presenteren;
- Als metadata-file uiteraard mét verbinding met het oorspronkelijke document voor download beschikbaar stellen;
- Als response op een webservice-aanroep terugleveren.
Voorbeeld: van een document dat herkend is als van het documenttype ‘Milieuvergunning’ kunnen de metadata ‘bevoegd gezag’, ‘datum afgifte’ en ‘locatie-duiding’ gevonden worden.
Configuratiemogelijkheden
Het proces is volledig inregelbaar. Denk aan de mate van handmatige nabewerking of controle, of bijvoorbeeld aan de configuratie van bron en bestemming. En denk zeker aan de instelbare betrouwbaarheidseisen en bijbehorende 'uitval-verwerking’.
Ondersteunde bestandstypen
De SDA ondersteunt de volgende mediatypen en informatieobjecten.
Soort |
Bestandstype |
DocTypes |
[FileType.PDF] |
ImageFileTypes |
[FileType.BMP, FileType.JPEG, FileType.JP2, FileType.JBIG, FileType.JBG, FileType.JPG, FileType.PNG, FileType.TIF, FileType.TIFF] |
OfficeFileTypes |
[FileType.DOC, FileType.DOCX, FileType.PPT, FileType.PPTX, FileType.XLS, FileType.XLSX]; |
OpenOfficeFileTypes |
[FileType.ODP, FileType.ODS, FileType.ODT]; |
EmailFileTypes |
[FileType.EML, FileType.MSG, FileType.TXT, FileType.PST]; |
WebFileTypes |
[FileType.ATOM, FileType.HTM, FileType.HTML, FileType.XHTML, FileType.XML, FileType.RSS]; |
CustomTypes |
[FileType.CSV]; |