Zodra je data wil gebruiken om een vraag te beantwoorden krijg je al snel te maken met termen zoals “pseudonimiseren” of “anonimiseren”. In dit kennisbank artikel leggen wij het verschil uit en waarom je zou kiezen voor het ene of het andere.

In veel datasets staan er gegevens over een persoon, zoals de naam, het adres, leeftijd, enzovoort. Dit is belangrijke informatie, omdat de gegevenshouder wel moeten weten over welke persoon zij gegevens hebben. Bij de huisarts moet je bijvoorbeeld weten van welke persoon de diagnose is of welke medicatie zij gebruiken. Echter, als deze data voor een ander doel gebruikt worden dan het primaire proces (zie Primair of Secundair?), dan is het niet de bedoeling dat je kan achterhalen over wie de data gaat.

Hiervoor kan je gebruik maken van pseudonimiseren of anonimiseren.

In de basis is het doel van pseudonimiseren en anonimiseren hetzelfde: je wil ervoor zorgen dat de gegevens niet herleidbaar zijn tot een persoon. Oftewel, je zou op basis van de gegevens die je hebt (simpelweg) niet kunnen weten over welke persoon die gegevens gaan.

Pseudonimiseren

Bij pseudonimiseren zet je de herleidbare persoonsgegevens om tot een zogeheten sleutel. Dit wordt bijvoorbeeld vaak gebruikt in wetenschappelijk onderzoek. Als deelnemer aan het onderzoek krijg je dan een code toegewezen, zoals D01 (deelnemernummer 01). In de dataset zie je dan van elke deelnemer wel alle onderzoeksgegevens, maar niet de persoonsgegevens. Het kan nodig zijn om terug te gaan naar de specifieke persoon, bijvoorbeeld als er bijwerkingen zijn bij geneesmiddelenonderzoek. Daarom is er een los sleutelbestand. In dat bestand staan de codes met daarbij de persoonsgegevens. In dit document kan je zien welke persoon D01 is.

Anonimiseren

Bij anonimiseren verwijder je alle herleidbare persoonsgegevens, los van de gegevens die je nodig hebt om je vraag te beantwoorden. Vaak heb je weinig aan een naam, adres of geboortedatum. Deze gegevens kan je verwijderen of omzetten naar iets dat minder herleidbaar is. In plaats van een geboortedatum kan je ook een leeftijd gebruiken en in plaats van het adres kan je gebruik maken van een postcode of woonplaats. Het belangrijke verschil tussen anonimiseren en pseudonimiseren is dat anonimiseren onomkeerbaar is. Je kan de gegevens niet weer terugvinden, omdat je deze verwijdert.

Maar moet ik nu pseudonimiseren of anonimiseren?

Dit is afhankelijk van het doel waarvoor je de data wil gebruiken. Als je data wil koppelen tussen verschillende bronnen is het nodig om te werken met gepseudonimiseerde data; je moet namelijk wel zeker weten dat de gegevens van dezelfde persoon zijn vanuit de verschillende bronnen. Als er geen reden is om iets terug te kunnen koppelen aan de persoon maak je gebruik van anonimiseren.

Op de website van de Autoriteit Persoonsgegevens kan je meer lezen over pseudonimiseren of anonimiseren, inclusief richtlijnen: https://www.autoriteitpersoonsgegevens.nl/themas/beveiliging/beveiliging-van-persoonsgegevens/gegevens-pseudonimiseren

Ontdek meer van Datapoort

Abonneer je nu om meer te lezen en toegang te krijgen tot het volledige archief.

Lees verder