Representação visual do modelo articulatório para o estudo da produção da fala

Branco, António Alberto Lebre dos Santos

Please use this identifier to cite or link to this item: http://hdl.handle.net/10773/32427

Title:	Representação visual do modelo articulatório para o estudo da produção da fala
Author:	Branco, António Alberto Lebre dos Santos
Advisor:	Tomé, Ana Maria Perfeito Vaz, Francisco António Cardoso
Keywords:	Produção da fala Aparelho vocal Linguística computacional Processamento da linguagem
Defense Date:	1997
Abstract:	Neste trabalho apresenta-se um sintetizador articulatório de voz que modela o aparelho vocal com parâmetros fisiológicos que variam lentamente com o tempo (ex. corpo da língua, lábios, velo, etc.). É usado um modelo articulatório de distância sagital baseado no modelo de Mermelstein (1973). Uma vez especificados os articuladores principais as dimensões sagitais são calculadas sobrepondo uma grelha não uniforme sobre o traçado do tracto vocal. As dimensões sagitais são convertidas para áreas seccionais usando diferentes fórmulas dependendo da região do tracto vocal. Reduz-se o tracto vocal a um conjunto de K secções, cada uma de forma cilíndrica, sendo a última secção terminada pela impedância de radiação. A função de transferência global do sistema H(w) é obtida calculando os ganhos de cada secção, desde a secção de radiação atá à glotis. Para calcular a impedância de radiação (impedância de carga da última secção) foi usado o modelo SKF. Os geradores de formantes foram implementados através de filtros de segunda ordem em paralelo derivados a partir da expansão em fracções parciais da função de transferência. Tendo sido utilizado para o cálculo das singularidades o método descrito em Lin (1995) de convergência mais rápida. Este método calcula primeiro o valor das singularidades no caso sem perdas, obtendo-se o valor para o caso com perdas através de interpolação linear. O modelo de excitação glotal usado para a produção de sons vozeados foi o polinómio de Rosenberg. Estuda-se o uso do método directo e inverso para o caso de vogais orais em configurações estáticas. Discute-se qual a informação que se pode retirar do modelo articulatório para a construção de ajudas visuais para fins de terapia da fala e mostram-se exemplos. In this work we present an articulatory synthesiser which models the vocal tract apparatus with slowly varying physiological parameters (e.g. tongue body, lips, velum, etc.). The articulatory distance model that is used was first developed by Mermelstein (1973). The midsagittal distances along the vocal tract are computed using a non-uniform grid. The mid-sagital distances are converted to sectional areas using different formulas depending of the region of the vocal tract. The vocal tract is reduced to K cylindrical sections terminated with a radiation impedance. The global transfer function H(w) is obtained computing each section gain, from the radiation section to the glotis. The SKF model was used for the radiation impedance at the lips. The formant generators were implemented with second order filters in parallel derived from the partial fraction expansion of the transfer function. To compute the singularities, a fast and robust method was used, this method first computes the poles and zeros with no losses, then putting back the losses the correct values are obtained with linear interpolation. The glottal excitation used to produce voiced sounds was the Rosenberg polynomial. The direct and inverse method were studied for the oral vowels, in static configurations. The information that one can extract from the model to use in visual aids for speech therapy is discussed.
URI:	http://hdl.handle.net/10773/32427
Appears in Collections:	UA - Dissertações de mestrado DETI - Dissertações de mestrado

Files in This Item:

File	Description	Size	Format
Documento_António_Branco.pdf		129.08 MB	Adobe PDF

Show full item record