Please use this identifier to cite or link to this item:
http://hdl.handle.net/10773/32427
Title: | Representação visual do modelo articulatório para o estudo da produção da fala |
Author: | Branco, António Alberto Lebre dos Santos |
Advisor: | Tomé, Ana Maria Perfeito Vaz, Francisco António Cardoso |
Keywords: | Produção da fala Aparelho vocal Linguística computacional Processamento da linguagem |
Defense Date: | 1997 |
Abstract: | Neste trabalho apresenta-se um sintetizador articulatório de voz que modela o aparelho vocal
com parâmetros fisiológicos que variam lentamente com o tempo (ex. corpo da língua, lábios, velo, etc.). É usado um modelo articulatório de distância sagital baseado no modelo de
Mermelstein (1973). Uma vez especificados os articuladores principais as dimensões sagitais
são calculadas sobrepondo uma grelha não uniforme sobre o traçado do tracto vocal. As
dimensões sagitais são convertidas para áreas seccionais usando diferentes fórmulas
dependendo da região do tracto vocal. Reduz-se o tracto vocal a um conjunto de K secções,
cada uma de forma cilíndrica, sendo a última secção terminada pela impedância de radiação.
A função de transferência global do sistema H(w) é obtida calculando os ganhos de cada
secção, desde a secção de radiação atá à glotis. Para calcular a impedância de radiação
(impedância de carga da última secção) foi usado o modelo SKF.
Os geradores de formantes foram implementados através de filtros de segunda ordem em
paralelo derivados a partir da expansão em fracções parciais da função de transferência. Tendo sido utilizado para o cálculo das singularidades o método descrito em Lin (1995) de
convergência mais rápida. Este método calcula primeiro o valor das singularidades no caso
sem perdas, obtendo-se o valor para o caso com perdas através de interpolação linear.
O modelo de excitação glotal usado para a produção de sons vozeados foi o polinómio de
Rosenberg.
Estuda-se o uso do método directo e inverso para o caso de vogais orais em configurações
estáticas. Discute-se qual a informação que se pode retirar do modelo articulatório para a
construção de ajudas visuais para fins de terapia da fala e mostram-se exemplos. In this work we present an articulatory synthesiser which models the vocal tract apparatus with slowly varying physiological parameters (e.g. tongue body, lips, velum, etc.). The articulatory distance model that is used was first developed by Mermelstein (1973). The midsagittal distances along the vocal tract are computed using a non-uniform grid. The mid-sagital distances are converted to sectional areas using different formulas depending of the region of the vocal tract. The vocal tract is reduced to K cylindrical sections terminated with a radiation impedance. The global transfer function H(w) is obtained computing each section gain, from the radiation section to the glotis. The SKF model was used for the radiation impedance at the lips. The formant generators were implemented with second order filters in parallel derived from the partial fraction expansion of the transfer function. To compute the singularities, a fast and robust method was used, this method first computes the poles and zeros with no losses, then putting back the losses the correct values are obtained with linear interpolation. The glottal excitation used to produce voiced sounds was the Rosenberg polynomial. The direct and inverse method were studied for the oral vowels, in static configurations. The information that one can extract from the model to use in visual aids for speech therapy is discussed. |
URI: | http://hdl.handle.net/10773/32427 |
Appears in Collections: | UA - Dissertações de mestrado DETI - Dissertações de mestrado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Documento_António_Branco.pdf | 129.08 MB | Adobe PDF |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.