ISCA Archive JEP 2022
ISCA Archive JEP 2022

Classification automatique de voyelles nasales pour une caractérisation de la qualité de voix des locuteurs par des réseaux de neurones convolutifs

Lila Kim, Cédric Gendrot

L’objectif de cette étude est d’évaluer, au moyen de réseaux de neurones convolutifs (CNN pour Convolutional Neural Networks), la capacité à discriminer acoustiquement une voyelle orale d’une voyelle nasale (voyelles /a/ et /ɑ̃/) sur un corpus de 45 locuteurs francophones. Pour une classification voyelle nasale vs. voyelle orale, les résultats obtenus peuvent atteindre 96% d’identification correcte. Ces résultats sont détaillés en fonction du locuteur, du contexte phonémique et de la durée. Dans la discussion, nous présentons une comparaison de ces résultats avec une mesure physiologique de nasalance. Une technique de visualisation (Grad-cam) est également mise en avant pour comprendre les zones du spectrogramme utilisées par le CNN.


doi: 10.21437/JEP.2022-82

Cite as: Kim, L., Gendrot, C. (2022) Classification automatique de voyelles nasales pour une caractérisation de la qualité de voix des locuteurs par des réseaux de neurones convolutifs. Proc. XXXIVe Journées d'Études sur la Parole -- JEP 2022, 779-787, doi: 10.21437/JEP.2022-82

@inproceedings{kim22_jep,
  author={Lila Kim and Cédric Gendrot},
  title={{Classification automatique de voyelles nasales pour une caractérisation de la qualité de voix des locuteurs par des réseaux de neurones convolutifs}},
  year=2022,
  booktitle={Proc. XXXIVe Journées d'Études sur la Parole -- JEP 2022},
  pages={779--787},
  doi={10.21437/JEP.2022-82}
}