Utilize este identificador para referenciar este registo: http://hdl.handle.net/10773/32427
Título: Representação visual do modelo articulatório para o estudo da produção da fala
Autor: Branco, António Alberto Lebre dos Santos
Orientador: Tomé, Ana Maria Perfeito
Vaz, Francisco António Cardoso
Palavras-chave: Produção da fala
Aparelho vocal
Linguística computacional
Processamento da linguagem
Data de Defesa: 1997
Resumo: Neste trabalho apresenta-se um sintetizador articulatório de voz que modela o aparelho vocal com parâmetros fisiológicos que variam lentamente com o tempo (ex. corpo da língua, lábios, velo, etc.). É usado um modelo articulatório de distância sagital baseado no modelo de Mermelstein (1973). Uma vez especificados os articuladores principais as dimensões sagitais são calculadas sobrepondo uma grelha não uniforme sobre o traçado do tracto vocal. As dimensões sagitais são convertidas para áreas seccionais usando diferentes fórmulas dependendo da região do tracto vocal. Reduz-se o tracto vocal a um conjunto de K secções, cada uma de forma cilíndrica, sendo a última secção terminada pela impedância de radiação. A função de transferência global do sistema H(w) é obtida calculando os ganhos de cada secção, desde a secção de radiação atá à glotis. Para calcular a impedância de radiação (impedância de carga da última secção) foi usado o modelo SKF. Os geradores de formantes foram implementados através de filtros de segunda ordem em paralelo derivados a partir da expansão em fracções parciais da função de transferência. Tendo sido utilizado para o cálculo das singularidades o método descrito em Lin (1995) de convergência mais rápida. Este método calcula primeiro o valor das singularidades no caso sem perdas, obtendo-se o valor para o caso com perdas através de interpolação linear. O modelo de excitação glotal usado para a produção de sons vozeados foi o polinómio de Rosenberg. Estuda-se o uso do método directo e inverso para o caso de vogais orais em configurações estáticas. Discute-se qual a informação que se pode retirar do modelo articulatório para a construção de ajudas visuais para fins de terapia da fala e mostram-se exemplos.
In this work we present an articulatory synthesiser which models the vocal tract apparatus with slowly varying physiological parameters (e.g. tongue body, lips, velum, etc.). The articulatory distance model that is used was first developed by Mermelstein (1973). The midsagittal distances along the vocal tract are computed using a non-uniform grid. The mid-sagital distances are converted to sectional areas using different formulas depending of the region of the vocal tract. The vocal tract is reduced to K cylindrical sections terminated with a radiation impedance. The global transfer function H(w) is obtained computing each section gain, from the radiation section to the glotis. The SKF model was used for the radiation impedance at the lips. The formant generators were implemented with second order filters in parallel derived from the partial fraction expansion of the transfer function. To compute the singularities, a fast and robust method was used, this method first computes the poles and zeros with no losses, then putting back the losses the correct values are obtained with linear interpolation. The glottal excitation used to produce voiced sounds was the Rosenberg polynomial. The direct and inverse method were studied for the oral vowels, in static configurations. The information that one can extract from the model to use in visual aids for speech therapy is discussed.
URI: http://hdl.handle.net/10773/32427
Aparece nas coleções: UA - Dissertações de mestrado
DETI - Dissertações de mestrado

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
Documento_António_Branco.pdf129.08 MBAdobe PDFrestrictedAccess


FacebookTwitterLinkedIn
Formato BibTex MendeleyEndnote Degois 

Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.