De Smart Privacy Analyzer scant documenten op gevoelige informatie. Wat 'gevoelige informatie' is, verschilt per organisatie en regelt u zelf in. Daardoor kan de Smart Privacy Analyzer die gevoelige informatie markeren en/of verbergen. Door toepassing van kunstmatige intelligentie en machine learning wordt de privacy analyzer steeds slimmer en steeds beter.
Compliancy
De Smart Privacy Analyzer helpt u bij actieve openbaarmaking van overheidsinformatie volgens de Wet open overheid (Woo), de vervanger van de Wet openbaarheid van bestuur (Wob). Bestuursorganen moeten bepaalde categorieën informatie verplicht actief openbaar maken via het Platform Open Overheidsinformatie (PLOOI). Daarbij gelden twee belangrijke aandachtspunten: het document moet voorzien zijn van de bedoelde metadata én het document moet geanonimiseerd zijn, oftewel ontdaan zijn van gevoelige informatie. De SDA zoekt en vindt metadata in en over het document, de SPA zoekt en behandelt gevoelige informatie.
Basisfuncties
Out-of-the-box kan de Smart Privacy Analyzer gegevens geautomatiseerd annoteren, verbergen en/of vervangen en de reden daarvoor onderbouwen. Daarvoor maken we gebruik van kunstmatige intelligentie en machine learning. Afhankelijk van de instellingen kan de gebruiker het eindresultaat altijd goedkeuren, kunnen afzonderlijke processtappen automatisch uitgevoerd worden (denk aan het aanbrengen van een tekstlaag in PDF-documenten) en valt zelfs volledig unattended anonimiseren binnen de mogelijkheden.
De SPA kan ingezet worden als eigenstandige SAAS-oplossing met verbinding naar de eigen document-omgeving. Ook aanroepen als webservice achter de eigen zaak- en taakapplicaties of als achtergrondproces is mogelijk
Lerend vermogen
De Smart Privacy Analyzer maakt gebruik van ‘machine learning’ principes waaronder Natural Language Processing en Deep Neural Networks. In de lerende modus is het mogelijk om het model te trainen zodat betrouwbaarheidspercentages van de gevoeligheidsanalyse hoger worden en het model breder en dieper werkt (meer documenttypes en andere informatie-elementen).
Werkwijze
Het proces begint met het uploaden van documenten. Vervolgens analyseert de AI de documenten op relevante informatie-elementen. Die worden gepresenteerd, waarna de gebruiker bij- of af kan annoteren. Daarna wordt het bestand gegenereerd en geëxporteerd.
Op hoofdlijnen kan de SPA worden ingezet als:
- Poortwachter bij binnenkomende data en/of documenten. Zo voorkomt u ontvangst van ongewenste, gevoelige informatie;
- Verwerker binnen bedrijfsprocessen om de verwerking van gevoelige informatie tot een minimum te beperken;
- Poortwachter bij uitgaande informatie. Zo voorkomt u uitwisseling van gevoelige informatie met onbevoegden buiten de organisatie.
Templating
Op basis van zelf geconfigureerde templates kan de SPA worden ingezet voor het verwerken van grote aantallen gelijkvormige documenten. AI wordt dan ingezet om de mate van gelijkvormigheid ten opzichte van het template te bepalen.
Configuratiemogelijkheden
Het proces is volledig inregelbaar. Denk aan de mate van handmatige nabewerking of controle, of bijvoorbeeld aan de configuratie van bron en bestemming. En denk zeker aan de instelbare betrouwbaarheidseisen en bijbehorende 'uitval-verwerking’.
Ondersteunde bestandstypen
De SPA ondersteunt de volgende mediatypen en informatieobjecten.
Soort |
Bestandstype |
DocTypes |
[FileType.PDF] |
ImageFileTypes |
[FileType.BMP, FileType.JPEG, FileType.JP2, FileType.JBIG, FileType.JBG, FileType.JPG, FileType.PNG, FileType.TIF, FileType.TIFF] |
OfficeFileTypes |
[FileType.DOC, FileType.DOCX, FileType.PPT, FileType.PPTX, FileType.XLS, FileType.XLSX]; |
OpenOfficeFileTypes |
[FileType.ODP, FileType.ODS, FileType.ODT]; |
EmailFileTypes |
[FileType.EML, FileType.MSG, FileType.TXT, FileType.PST]; |
WebFileTypes |
[FileType.ATOM, FileType.HTM, FileType.HTML, FileType.XHTML, FileType.XML, FileType.RSS]; |
CustomTypes |
[FileType.CSV]; |