ISCA Archive SPOSS 1998
ISCA Archive SPOSS 1998

Extent of context and vowel identification in speech variation

Sheila M. Williams, Randy L. Diehl

In spontaneous speech vowel formant patterns vary from those traditionally associated with each vowel category due to processes of coarticulation, temporal reduction, elision and speech style. Nevertheless, the familiarization period necessary to enable thelistener to adapt to a novel speaker or speech style is generally brief.Here we investigate the extent of context necessary to distanalyzed examples of speech produced by local speakers, we were able to analyzed examples of speech produced by local speakers, we were able to manipulate formant structure so that formant peaks of some of the stimuli closely resemble those of different vowels. Despite no significant difference between word and vowel recognition on a similar practice set of words, listeners identified the source words of excised vowels from manipulated words significantly less well than the complete monopthongal words. However, after having heard the complete words, the listeners were able to attribute the excised vowels to their source words almost as well as the complete words(no significant difference) indicating that the learning period for speaker characteristics is very brief. Speech styles ranging from spontaneous speech through read speech to citation form isolated vowels are discussed within the context of these results [work supported by NIDCD Grant No. R01 DC00427-10]. Résumé

En parole spontanée, les configurations des formants de voyelles diffèrent de celles traditionnellement associées à chacune descatégories de voyelles. Ce phénomène est dû aux processus decoarticulation, de réduction temporelle, d'élision et au style deparole. Néanmoins, la période d'adaptation nécessaire pourqu'un interlocuteur se familiarise à un nouveau style de parole estnormalement brève. Cette étude examine la durée du contexte nécessaire pour distinguer entre une variation due au parleur (par exemple, F2 toujours élevée ou basse) et au contraste catégoriel. En composant une nouvelle synthèse d'échantillons de parole produits par des membres de la communauté, la structure des formants a été manipulée de sorte que les formants du noyau d'une syllabe s'approchent des formants d'une voyelle différente. Bien qu'il n'existe aucune différence entre la reconnaissance des voyelles ou des mots tirés d'un groupes de mots donné, les auditeurs identifient significativement moins bien le mot source d'une voyelle extraite à partir des mots modifiés, avant d'avoir entendu ces mots complets. Par contre, lorsqu'ils ont entendu les mots complets, les auditeurs peuvent attribuer les voyelles aux mots sources aussi efficacement que dans le cas des mots complets modifiés, indiquant que la période d'apprentissage des caractéristiques de l'interlocuteur est très brève. Une gamme des styles de parole qui va de la parole spontanée aux listes de voyelles isolées est discutée en relation avec les résultats obtenus [recherche souscrite par NIDCD Grant No. ROl DC00427-10].


Cite as: Williams, S.M., Diehl, R.L. (1998) Extent of context and vowel identification in speech variation. Proc. ETRW - Sound Patterns of Spontaneous Speech (SPoSS), 117-120

@inproceedings{williams98_sposs,
  author={Sheila M. Williams and Randy L. Diehl},
  title={{Extent of context and vowel identification in speech variation}},
  year=1998,
  booktitle={Proc. ETRW - Sound Patterns of Spontaneous Speech (SPoSS)},
  pages={117--120}
}