Projet DecRIPT : bilan et références

ERDIL a participé, dans le cadre du projet Interrégional DecRIPT (2019 – 2022), à plusieurs travaux autour de l’Anonymisation de verbatim ou ZLC (Zones Libres de Commentaires).

Bilan du projet

La problématique à l’origine de ces travaux était que les ZLC peuvent contenir des données personnelles, et le RGPD impose dans certains cas de les anonymiser (pour être précis : les pseudonymiser au minimum), avant toute externalisation, quelle qu’en soit la destination et la finalité.

Il existe de nombreuses solutions d’éditeurs pour anonymiser des données structurées (bases de données typiquement), mais aucune exploitable (à ce jour) pour anonymiser des données personnelles noyées dans un texte (une ZLC), ce que montre l’étude réalisée par ERDIL dans la cadre du projet DecRIPT (35 solutions du marché ont été étudiées).

Un prototype (AnonymizR) de logiciel d’anonymisation de ZLC a été conçu et développé par ERDIL (toujours dans le cadre du projet DecRIPT), se basant sur un autre module du même projet : CrypTex, qui se charge de la détection et de la localisation des données personnelles dans un texte.

AnonymizR permet de configurer différentes stratégies d’anonymisation en fonction de typologies de données personnelles (exemple : IBAN, SSN, Email, n° de téléphone…), toutes étant irréversibles. Certaines stratégies sont simples (remplacement par un caractère fixe, génération d’une valeur aléatoire de même type métier), d’autres plus avancées  (substitution à partir de tables, avec ou sans déterminisme, avec ou sans préservation de la longueur des données personnelles).

Références pour aller plus loin

Voici des références et liens utiles :

Généralités :

Anonymisation :

Date

24 juin 2022

Auteur
Logo ERDIL

ERDIL

Découvrez nos autres articles