Redactie - 25 juli 2019

Onderzoekers herleiden geanonimiseerde data naar individuen

Geanonimiseerde data van mensen kan nog steeds worden herleid tot individuele personen. Onderzoekers van de UCLouvain kunnen je met een handvol kenmerken tot 99,98 procent accuraat identificeren.

Het onderzoek is uitgevoerd door de de Belgische universiteit UCLouvain samen met het Imperial College of London. Zij stellen vast dat geanonimiseerde data met behulp van machine learning en kunstmatige intelligentie kan worden herleid naar individuen. Hun bevindingen worden ook gepubliceerd in het wetenschappelijke tijdschrift Nature Communications.

Anonimiseren

Bedrijven of overheden die data vragen van klanten of burgers zijn voor de verwerking onderhevig aan de privacywetgeving, zoals de GDPR. Maar zodra die data wordt geanonimiseerd valt ze niet meer onder die wetten en mag ze in principe worden verkocht aan derden. Dat anonimiseren gebeurt onder meer door er ruis aan toe te voegen en persoonlijke identificaties zoals namen, telefoonnummers, adressen en e-mailadressen te verwijderen. Zo is iemand niet langer herkenbaar, werd tot op heden aangenomen.

Maar met moderne technologie tonen beide onderzoeksinstellingen dat dat in praktijk niet het geval is. Met hooguit 15 kenmerken zoals leeftijd, geslacht, burgerlijke staat.. slaagden ze er in om uit een dataset van Amerikaanse burgers mensen met 99,98 procent correctheid te herkennen.

"Als het gaat over mannen van rond de dertig die in New York leven dan zijn dat er veel. Maar als we kijken naar degenen die op 5 januari zijn geboren, met een rode sportwagen rijden, twee dochters en een hond hebben, dan zijn dat er zeer weinig," geeft Dr Luc Rocher van UCLouvain als voorbeeld.

Dataverkoop

Het gevaar zit hem vooral in situaties waarbij geanonimiseerde data wordt doorverkocht. Wie in staat is om mensen te identificeren krijgt zo een hoop persoonlijke gegevens in handen.

"Het is vrij standaard dat bedrijven dit soort gegevens vragen en op dat moment vallen ze onder de GDPR. Maar ze zijn wel vrij om die data door te verkopen zodra ze geanonimiseerd is. Ons onderzoek toont aan hoe makkelijk, en accuraat, individuen terug kunnen getraceerd worden", zegt Dr Yves-Alexandre de montoye van het Imperial College of Londen.

Het is niet de eerste keer dat geanonimiseerde gegevens toch kunnen worden getraceerd. Jaren geleden bleek al dat geanonimiseerde IP-adressen konden teruggeleid worden tot ongeveer 1 op 2 gebruikers.

In samenwerking met Datanews