Cette étude s'intéresse à l’évaluation automatique de la parole de Japonais apprenant le français. Nos données sont des productions orales semi-spontanées, issues du corpus CLIJAF. Nous évaluons différents niveaux linguistiques (prononciation, lexique, syntaxe, discours) à l’aide de mesures automatiques. Notre premier objectif est d’étudier si ces mesures sont en adéquation avec le niveau général des apprenants, tel que défini par le CECRL (A2 à C2). Notre deuxième objectif est d’explorer la possibilité de prédire ledit niveau en utilisant les paramètres linguistiques les plus pertinents, avec un algorithme d’apprentissage automatique non-supervisé. Les résultats obtenus valident la pertinence de nos objectifs et montrent que des paramètres extraits automatiquement tels que la diversité lexicale, la longueur moyenne des tours de parole (niveau syntaxique), la proportion de marqueurs du discours et plusieurs paramètres liés à la fluence peuvent contribuer à la prédiction du niveau des apprenants.
Cite as: Fino, V.D., Fontan, L., Pinquier, J., Barcat, C., Ferrané, I., Detey, S. (2022) Mesures automatiques de parole non-native : exploration pilote d’un corpus d’apprenants japonais de français et différenciation de niveaux. Proc. XXXIVe Journées d'Études sur la Parole -- JEP 2022, 693-702, doi: 10.21437/JEP.2022-73
@inproceedings{fino22_jep, author={Verdiana De Fino and Lionel Fontan and Julien Pinquier and Corentin Barcat and Isabelle Ferrané and Sylvain Detey}, title={{Mesures automatiques de parole non-native : exploration pilote d’un corpus d’apprenants japonais de français et différenciation de niveaux}}, year=2022, booktitle={Proc. XXXIVe Journées d'Études sur la Parole -- JEP 2022}, pages={693--702}, doi={10.21437/JEP.2022-73} }