EUROSPEECH 2003 - INTERSPEECH 2003
8th European Conference on Speech Communication and Technology

Geneva, Switzerland
September 1-4, 2003

        

Unified Analysis of Glottal Source Spectrum

Ixone Arroabarren, Alfonso Carlosena

Universidad Publica de Navarra, Spain

The spectral study of the glottal excitation has traditionally been based on a single time-domain mathematical model of the signal, and the spectral dependence on its time domain parameters. Opposite to this approach, in this work the two most widely used time domain models have been studied jointly, namely the KLGLOTT88 and the LF models. Their spectra are analyzed in terms of their dependence on the general glottal source parameters: Open quotient, asymmetry coefficient and spectral tilt. As a result, it has been proved that even though the mathematical expressions for both models are quite different, they can be made to converge. The main difference found is that in the KLGLOTT88 model the asymmetry coefficient is not independent of the open quotient and the spectral tilt. Once this relationship has been identified and translated to LF model, both models are shown to be equivalent in both time and frequency domains. En este trabajo se ha analizado el espectro de la derivada de la fuente glotal. Este tipo de estudios tradicionalmente se han enfocado hacia el estudio de un determinado modelo de la fuente glotal, y como afectan los parametros temporal de dicho modelo a su espectro. Por el contrario, en este caso se pretende dar una vision mas general, y para ello se han estudiado conjuntamente dos de los modelos temporales de fuente glotal mas relevantes: el modelo KLGLOTT88 y el modelo LF. El espectro de ambos modelos ha sido estudiado en terminos de las tres caracteristicas de la fuente glotal que tiene modelar cualquier modelo matematico: el cociente de apertura, el coeficiente de asimetria y la tendencia o inclinacion espectral. Como consecuencia de este estudio se ha podido comprobar que a pesar de que las expresiones matematicas de ambos modelos son muy diferentes, la principal diferencia entre ambos reside en que en el caso del modelo KLGLOTT88 el coeficiente de asimetria viene determinado por el cociente de apertura y la tendencia espectral. Dada la relacion matematica entre los parametros se puede demostrar que en estas condiciones ambos modelos de fuente son equivalentes en el domino temporal y el dominio espectral.

Full Paper

Bibliographic reference.  Arroabarren, Ixone / Carlosena, Alfonso (2003): "Unified analysis of glottal source spectrum", In EUROSPEECH-2003, 1761-1764.