Anonymisation ou pseudonymisation des données ? 

En ce qui concerne la protection des données, il existe deux méthodes à évaluer en vue du RGPD. L’anonymisation qui permet une sécurisation accrue et la pseudonymisation qui offre davantage de souplesse.

Avec le RGPD, toutes les entreprises sont confrontées à la sécurisation des données. Le texte de loi préconise certaines techniques pour protéger les données des citoyens européens notamment l’anonymisation et la pseudonymisation.

L’anonymisation est un procédé définitif qui consiste à changer le contenu ou la structure même des données. Toutes les informations qui permettent d’identifier directement ou indirectement des personnes sont supprimées ou modifiées. Cela rend normalement impossible toute réidentification. Sur le papier, l’anonymisation présente un niveau de protection optimal.

Des risques de réidentification par recoupement

Bien qu’intéressante au départ, cette méthode reste très difficile à mettre en place. En effet, plus le volume de données est important, plus les risques de réidentification par recoupement sont élevés. Des informations totalement anonymisées peuvent amener à l’identification d’une personne en fonction des informations relevées qui permettent de déduire le comportement, comme les habitudes de navigation sur internet ou bien les historiques d’achats en ligne.

Le recoupement de deux collectes peut faire apparaître des données sensibles, ou bien réidentifier des individus dont les données avaient été pourtant anonymisées.

Il est donc conseillé, pour les responsables de traitement utilisant des solutions d’anonymisation, d’effectuer une veille régulière pour préserver, dans le temps, le caractère anonyme des données produites. Une anonymisation, garantie à un jour donné, n’étant pas nécessairement assurée dans la durée à l’heure du big data et de l’intelligence artificielle.

Une bonne solution d’anonymisation doit reposer sur trois critères :

  • l’individualisation (est-il toujours possible d’isoler un individu ?),
  • la corrélation (est-il possible de relier entre eux des ensembles de données distincts concernant un même individu ?)
  • l’inférence (peut-on déduire de l’information sur un individu ?).

L’alternative de la pseudonymisation

L’anonymisation présente certains désavantages. Cependant, elle peut être substituée par une autre solution appelée la pseudonymisation. Il s’agit d’un processus non définitif qui consiste à remplacer un attribut par un autre au sein d’un enregistrement. La pseudonymisation est une technique privilégiée dans les projets où l’identité d’un individu n’est pas essentielle.

Le RGPD fait à plusieurs reprises allusion à la pseudonymisation. En effet, dans son article 25, le règlement cite explicitement la pseudonymisation parmi les mesures techniques et organisationnelles recommandées pour la protection des données à mettre en place le responsable de traitement.

Plus simple à mettre en œuvre que l’anonymisation, la pseudonymisation permet de se conformer aux nouveaux principes de protection dès la conception (privacy by design) et de protection par défaut (privacy by default).