SPoSS - Sound Patterns of Spontaneous Speech

La Baume-les-Aix, France
September 24-26, 1998

Vowel Quality in Spontaneous Speech: What Makes a Good Vowel?

Matthew Aylett (1,2), A. Turk (2)

(1) Human Communication Research Centre; (2) Department of Linguistics, University of Edinburgh, UK

La parole distincte se caractérise par des durées segmentaires plus longues et un pourcentage plus élevé d'atteinte du cible; ceci a comme conséquence des traits segmentaires plus extrêmes. Dans cet article, nous traitons de la clarté des voyelles produites en parole spontanée dans un grand corpus de dialogues orientés à une tâche. Nous présentons une technique automatique pour mesurer la clarté d'une voyelle a partir des caractéristiques spectrales de la voyelle. Cette technique a été évaluée par une analyse perceptuelle. Les sujets ont évalué la 'qualité' des voyelles ayant de différentes caractéristiques spectrales avec la longueur et l'amplitude contrôlées, et ces résultats ont été comparés avec une évaluation automatique. Les résultats indiquent que tandis que l'accord entre les sujets et la mesure automatique est assez mauvais, il est aussi mauvais que l'accord entre les sujets.

Est-ce qu'un modèle statistique peut efficacement prédire la réponse des sujets a de telles voyelles.

  1. Est-ce que les sujets peuvent efficacement juger la clarté de voyelles extraites de la parole spontanée sans en savoir la durée?
  2. Est-ce qu'un modèle statistique peut efficacement prédire la réponse des sujets a de telles voyelles?


Full Paper

Bibliographic reference.  Aylett, Matthew / Turk, A. (1998): "Vowel quality in spontaneous speech: what makes a good vowel?", In SPoSS-1998, 113-116.