Dans cet article nous étudions la résistance des systèmes de reconnaissance du locuteur de l'état de l'art face aux variabilités acoustiques, telles que le bruit additif et la réverbération. Deux systèmes seront comparés, le premier est fondé sur TDNN et le second est fondé sur ResNet. Nous montrerons que globalement et sans utilisation de techniques de compensation le ResNet est plus robuste aux bruit que le TDNN. Les techniques de compensation dans le cas des TDNN sont efficaces dans le cas de bruits ajouté, alors qu'elles n'apporte aucun gain dans le cas du ResNet. En outre, les performances obtenues avec ResNet sans compensation restent supérieures à celles d'un TDNN, même avec compensation. Les expériences sont réalisées en utilisant les corpus Fabiol et Voices. Des visualisations graphiques et des expériences complémentaires sont réalisées afin de donner des explications à ces différences de comportement face aux bruits du TDNN et du ResNet.
Cite as: Mohammadamini, M., Matrouf, D., Dowerah, S., Serizel, R., Jouvet, D., Bonastre, J.-F. (2022) Le comportement des systèmes de reconnaissance du locuteur de l'état de l'art face aux variabilités acoustiques. Proc. XXXIVe Journées d'Études sur la Parole -- JEP 2022, 241-249, doi: 10.21437/JEP.2022-26
@inproceedings{mohammadamini22_jep, author={Mohammad Mohammadamini and Driss Matrouf and Sandipana Dowerah and Romain Serizel and Denis Jouvet and Jean-François Bonastre}, title={{Le comportement des systèmes de reconnaissance du locuteur de l'état de l'art face aux variabilités acoustiques}}, year=2022, booktitle={Proc. XXXIVe Journées d'Études sur la Parole -- JEP 2022}, pages={241--249}, doi={10.21437/JEP.2022-26} }