ISCA Archive JEP 2022
ISCA Archive JEP 2022

Extraction d'informations liées au locuteur depuis un modèle acoustique personnalisé

Salima Mdhaffar, Jean François Bonastre, Marc Tommasi, Natalia Tomashenko, Yannick Estève

Plusieurs services intégrés dans notre vie quotidienne utilisent la reconnaissance automatique de la parole(Apple-Siri, Amazon-Alexa...). Ces services s'appuient sur des modèles entraînés sur une grande quantité de données pour assurer leur efficacité. Les données utilisées sont collectées via les applications, à partir des interactions des utilisateurs. Elles contiennent souvent des informations sensibles, ce qui peut créer d'importants problèmes de confidentialité. Dans ce contexte, de nouveaux paradigmes d'apprentissage automatique ont été proposés, comme l'apprentissage fédéré et distribué. Tous deux permettent de créer des modèles personnalisés à partir de données privées. Seuls les modèles sont alors partagés, sans exposer les données elles-mêmes.Une question cruciale est de savoir si la diffusion de ces modèles acoustiques(MA) personnalisés peut aussi entraîner une fuite d'informations personnelles. Les résultats montrent qu'il est possible de retrouver des informations liées au locuteur en s'appuyant sur les modifications de poids d'un MA induites par l'adaptation locale sur ce locuteur.


doi: 10.21437/JEP.2022-6

Cite as: Mdhaffar, S., Bonastre, J.F., Tommasi, M., Tomashenko, N., Estève, Y. (2022) Extraction d'informations liées au locuteur depuis un modèle acoustique personnalisé. Proc. XXXIVe Journées d'Études sur la Parole -- JEP 2022, 54-62, doi: 10.21437/JEP.2022-6

@inproceedings{mdhaffar22_jep,
  author={Salima Mdhaffar and Jean François Bonastre and Marc Tommasi and Natalia Tomashenko and Yannick Estève},
  title={{Extraction d'informations liées au locuteur depuis un modèle acoustique personnalisé}},
  year=2022,
  booktitle={Proc. XXXIVe Journées d'Études sur la Parole -- JEP 2022},
  pages={54--62},
  doi={10.21437/JEP.2022-6}
}