DYSAN: Dynamically sanitizing motion sensor data against sensitive inferences through adversarial networks

With the widespread adoption of the quantified self movement, an increasing number of users rely on mobile applications to monitor their physical activity through their smartphones. Granting to applications a direct access to sensor data expose users to privacy risks. Indeed, usually these motion sensor data are transmitted to analytics applications hosted on the cloud leveraging machine learning models to provide feedback on their health to users. However, nothing prevents the service provider to infer private and sensitive information about a user such as health or demographic attributes. In this paper, we present DySan, a privacy-preserving framework to sanitize motion sensor data against unwanted sensitive inferences (i.e., improving privacy) while limiting the loss of accuracy on the physical activity monitoring (i.e., maintaining data utility). To ensure a good trade-off between utility and privacy, DySan leverages on the framework of Generative Adversarial Network (GAN) to sanitize the sensor data. More precisely, by learning in a competitive manner several networks, DySan is able to build models that sanitize motion data against inferences on a specified sensitive attribute (e.g., gender) while maintaining a high accuracy on activity recognition. In addition, DySan dynamically selects the sanitizing model which maximize the privacy according to the incoming data. Experiments conducted on real datasets demonstrate that DySan can drastically limit the gender inference to 47% while only reducing the accuracy of activity recognition by 3% (from 95% with raw data to 92% with sanitized data).

Avec l’adoption généralisée du suivi d’activité, un nombre croissant d’utilisateurs s’appuient sur des applications mobiles pour surveiller leur activité physique par le biais de leur smartphone. Le fait d’accorder aux applications un accès direct aux données des capteurs expose les utilisateurs à des risques pour leur vie privée. En effet, ces données de capteurs de mouvement sont généralement transmises à des applications d’analyse hébergées sur le cloud, qui exploitent des modèles d’apprentissage machine pour fournir aux utilisateurs un retour d’information sur leur santé. Cependant, rien n’empêche le fournisseur de services d’inférer des informations privées et potentiellement sensibles sur un utilisateur, telles que des attributs démographiques ou de santé. Dans cet article, nous présentons DySan, un système de préservation de la vie privée pour assainir les données provenant de capteurs de mouvement contre les inférence non désirées d’informations sensibles (c’est-à-dire améliorer la vie privée) tout en limitant la perte de précision sur la surveillance de l’activité physique (c’est-à-dire maintenir une certaine utilité dans les données protégées). Pour garantir un bon compromis entre utilité et respect de la vie privée, DySan s’appuie sur des Réseaux génératifs Adversariaux (GAN) pour assainir les données issues des capteurs. Plus précisément, en apprenant de manière compétitive plusieurs réseaux, DySan est capable de construire des modèles d’apprentissage machine qui assainissent les données de mouvement contre l’inférence d’un attribut sensible spécifié (par exemple, le genre) tout en maintenant une grande précision sur la reconnaissance d’activité. De plus, DySan construit divers modèles d’assainissement, caractérisés par différents ensembles d’hyperparamètres dans la fonction de perte globale, pour proposer un schéma d’apprentissage du transfert dans le temps en sélectionnant dynamiquement le modèle qui offre le meilleur compromis entre utilité et respect de la vie privée en fonction des données entrantes. Les expériences menées sur des ensembles de données réels montrent que DySan peut limiter considérablement l’inférence de genre jusqu’à 41% (de 98% avec des données brutes à 57% avec des données assainies) tout en ne réduisant la précision de la reconnaissance d’activité que de 3% (de 95% avec des données brutes à 92% avec des données assainies)

Mots clés

Privacy Artificial intelligence Transparency Health data Confidentiality Privacy

Vie privée Intelligence artificielle Transparence Données de santé Confidentialité Vie privée

Domaines

Intelligence artificielle [cs.AI] Cryptographie et sécurité [cs.CR]

Fichier principal

RR-9325.pdf (1.84 Mo)

sources/RR-9235.bcf (90.9 Ko)

sources/RR-9235.pdf (1.84 Mo)

Origine : Fichiers produits par l'(les) auteur(s)

Antoine Boutet : Connectez-vous pour contacter le contributeur

https://inria.hal.science/hal-02512640

Soumis le : mardi 20 octobre 2020-11:44:13

Dernière modification le : jeudi 6 avril 2023-11:20:13

Dates et versions

hal-02512640 , version 1 (23-03-2020)

hal-02512640 , version 2 (20-10-2020)

hal-02512640 , version 3 (24-01-2022)

Identifiants

HAL Id : hal-02512640 , version 2
ARXIV : 2003.10325

Citer

Rosin Claude Ngueveu, Antoine Boutet, Carole Frindel, Sébastien Gambs, Théo Jourdan, et al.. DYSAN: Dynamically sanitizing motion sensor data against sensitive inferences through adversarial networks. [Research Report] RR-9325, inria. 2020, pp.27. ⟨hal-02512640v2⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

INRIA-RRRT LARA

316 Consultations

339 Téléchargements