ISCA Archive JEP 2022
ISCA Archive JEP 2022

Analyse phonétique de la variation inter-locuteurs au moyen de réseaux de neurones convolutifs : voyelles seules et séquences courtes de parole

Cedric Gendrot, Emmanuel Ferragne, Anaïs Chanclu

Des réseaux de neurones convolutifs ont été entraînés sur des spectrogrammes de voyelles /ɑ̃/ et de séquences aléatoires de 2 secondes extraites à partir de 45 locuteurs du corpus NCCFr afin d’obtenir une classification de ces derniers. Ces deux modèles présentent une répartition équivalente des locuteurs dans l'espace acoustique, ce qui suggère que la classification a été faite sur des critères indépendants des phonèmes précis extraits. De multiples mesures phonétiques ont été effectuées afin de tester leur corrélation avec les représentations obtenues : la f0 apparait comme le paramètre le plus pertinent, suivie par plusieurs paramètres liés à la qualité de la voix. Des zones d’activation ont été calculées a posteriori afin de montrer les zones spectrales et temporelles utilisées par le réseau. Une analyse quantitative de ces cartes d'activation a donné lieu à des représentations des locuteurs qui ne sont pas corrélées aux mesures phonétiques.


doi: 10.21437/JEP.2022-94

Cite as: Gendrot, C., Ferragne, E., Chanclu, A. (2022) Analyse phonétique de la variation inter-locuteurs au moyen de réseaux de neurones convolutifs : voyelles seules et séquences courtes de parole. Proc. XXXIVe Journées d'Études sur la Parole -- JEP 2022, 891-899, doi: 10.21437/JEP.2022-94

@inproceedings{gendrot22_jep,
  author={Cedric Gendrot and Emmanuel Ferragne and Anaïs Chanclu},
  title={{Analyse phonétique de la variation inter-locuteurs au moyen de réseaux de neurones convolutifs : voyelles seules et séquences courtes de parole}},
  year=2022,
  booktitle={Proc. XXXIVe Journées d'Études sur la Parole -- JEP 2022},
  pages={891--899},
  doi={10.21437/JEP.2022-94}
}