La prédiction automatique de l’intelligibilité de la parole est un sujet pertinent pour l'évaluation de la parole pathologique. Cette automatisation permet de limiter les biais et la subjectivité liés aux évaluations perceptuelles, évaluations très courantes en pratique clinique, et ainsi rendre plus robuste l'évaluation du patient. Dans ce travail, nous calculons un score d'intelligibilité basé sur une tâche de décodage acoustique-phonétique, où un ensemble de pseudo-mots est prononcé par des patients atteints de cancer ORL. Notre approche est fondée sur des réseaux de neurones profonds avec attention. Nous obtenons un score automatique d'intelligibilité fortement corrélé à l'évaluation perceptive ($\rho=0,87$), ainsi qu'une diminution de l'erreur par rapport aux approches concurrentes. En étudiant la fiabilité de notre prédiction sur un sous-ensemble de notre corpus, nous montrons qu'il est possible d'obtenir des résultats très similaires en utilisant de faibles quantités de données.
Cite as: Quintas, S., Abad, A., Mauclair, J., Woisard, V., Pinquier, J. (2022) Utilisation de réseaux de neurones profonds avec attention pour la prédiction de l’intelligibilité de la parole de patients atteints de cancers ORL. Proc. XXXIVe Journées d'Études sur la Parole -- JEP 2022, 63-71, doi: 10.21437/JEP.2022-7
@inproceedings{quintas22_jep, author={Sebastião Quintas and Alberto Abad and Julie Mauclair and Virginie Woisard and Julien Pinquier}, title={{Utilisation de réseaux de neurones profonds avec attention pour la prédiction de l’intelligibilité de la parole de patients atteints de cancers ORL}}, year=2022, booktitle={Proc. XXXIVe Journées d'Études sur la Parole -- JEP 2022}, pages={63--71}, doi={10.21437/JEP.2022-7} }