Les données FCD sont issues du suivi de véhicules terrestres.
Chaque véhicule se voit attribué un identifiant permettant de suivre ses déplacements.
Les identifiants sont par définition anonymes : c’est une série de chiffres et/ou de lettres générée automatiquement sans relation avec une date, un lieu ou une autre donnée. On parle de « pseudonymes ».
Cependant, si un identifiant est associé en permanence à un équipement/un véhicule, il est possible dans la durée d’identifier la ou les personnes à l’origine de ces déplacements. Les trajets domicile – travail, souvent effectués à des moments réguliers, permettent d’identifier Le domicile de la ou des personnes utilisant ce véhicule.
Pour éviter cela, un identifiant est réattribué sur une fréquence temporelle plus ou moins longue de quelques minutes, durée minimale pour que les données GPS soient utiles, à 24h.
Une autre possibilité est d’attribuer un nouvel identifiant au démarrage des équipements.
La technique consiste à découper les trajets en plusieurs traces suivant des durées aléatoires et en insérant des « trous » de durée variable entre chacune de ces traces.
On peut en complément supprimer des minutes de données au départ et à l’arrivée d’un trajet pour en masquer l’origine et la destination, ce qui pose naturellement des problèmes pour la réalisation d’études origine-destination
La technique consiste à découper les trajets en plusieurs traces suivant des durées aléatoires et en insérant des « trous » de durée variable entre chacune de ces traces.
On peut en complément supprimer des minutes de données au départ et à l’arrivée d’un trajet pour en masquer l’origine et la destination, ce qui pose naturellement des problèmes pour la réalisation d’études origine-destination
Le principe est de diminuer la précision des points de départs et des points d’arrivée. En France on peut ainsi approximer un point de départ ou d’arrivée au niveau IRIS de l’INSEE. Il sera impossible d’identifier une personne parmi les 2 000 qui composent une cellule IRIS.
Une autre technique est de réduire le nombre de décimales des coordonnées géographiques. Moins précises, elles « floutent » l’origine et la destination.
La chronologie des points est indispensable pour pouvoir utiliser les données FCD et procéder à des analyses. Une technique pour améliorer l’anonymisation des données est de réduire la précision temporelle :
• En ajoutant ou en retranchant des secondes aux timestamp ;
• En ramenant les heures de départ ou d’arrivée à une heure entière et décaler d’autant les timestamps des points suivants de la trace soit en absolu (recalcul), soit en relatif (plus xx secondes).
L’anonymisation est rendue difficile dans les zones peu fréquentées par les véhicules. Dans ce cas, le plus simple est de ne pas diffuser ces données pour éviter toute reconnaissance des personnes.
Dans tous les cas, la conservation de ces données ne doit se faire que pour leur durée d’utilisation. Au-delà, il est indispensable de procéder à leur effacement des données. De même, les accès à ces données doivent faire l’objet d’une sécurisation répondant aux standards pour éviter tout piratage.
Benoît Ogier
Expert géomaticien chez Carte Blanche Conseil