Please use this identifier to cite or link to this item: http://hdl.handle.net/10773/35068
Title: Classificação automática de artigos estigmatizantes de doenças mentais em jornais de notícias portugueses online
Other Titles: Automatic classification of stigmatizing articles of mental illness in Portuguese online newspapers
Author: Yanchuk, Alina
Advisor: Trifan, Alina Liliana
Oliveira, José Luis Guimarães
Keywords: Classificação de texto
Classificação automática
Inteligência artificial
Jornais de notícias
Processamento de linguagem natural
Machine learning
Deep learning
Topic modeling
Defense Date: 28-Jul-2022
Abstract: Os meios de comunicação social, nomeadamente os jornais de notícias presentes na Internet, são os principais responsáveis pelo fornecimento de informação ao público e possuem uma grande influência na modelação da nossa sociedade. A presença de estigma associado à saúde mental continua a ser frequente nos artigos publicados nos mesmos, onde, muitas vezes, as doenças mentais são utilizadas de forma metafórica para se referir a entidades ou situações fora do contexto clínico da saúde mental. Tendo em conta que a análise manual deste problema requer um grande esforço humano e tempo, este projeto explora a implementação de técnicas de Inteligência Artificial e de Processamento de Linguagem Natural para a tarefa de classificação automática de artigos estigmatizantes dos transtornos mentais da esquizofrenia e psicose, presentes em jornais de notícias portugueses online e recolhidos do repositório público Arquivo.pt. Foram implementados dez algoritmos de machine learning e deep learning para a realização desta tarefa, sendo que 45% dos modelos permitiram obter resultados com exatidão acima dos 90%. Além disso, foi também realizada a deteção automática de tópicos presentes nos artigos, através de topic modeling com o modelo top2vec, que permitiu concluir que a estigmatização da saúde mental ocorre, essencialmente, nas temáticas da Economia e Política. Os resultados experimentais confirmam a existência de estigma nos jornais de notícias portugueses (52% dos 978 artigos recolhidos) e a eficácia da utilização de modelos computacionais para a sua deteção. Adicionalmente, é criado e disponibilizado um conjunto de 978 artigos recolhidos e manualmente anotados com as classes “estigmatizante” e “literal”.
The media, namely the written newspapers available on the Internet are primarily responsible for providing information to the public and have a great influence on shaping our society. The presence of stigma related to mental health remains frequent in the articles published online, where mental diseases are often used metaphorically to refer to entities or situations outside the clinical context of mental health. Considering that the manual analysis of this problem requires a great deal of human effort and time, this project explores the implementation of Artificial Intelligence and Natural Language Processing techniques for the task of automatically classifying stigmatizing articles on the mental disorders of schizophrenia and psychosis, present in Portuguese online newspapers and collected from the public repository Arquivo.pt. Ten machine learning and deep learning algorithms were implemented to perform this task, and 45% of the models led to results with accuracy above 90%. In addition, the automatic detection of the articles topics was also performed, through topic modeling with the top2vec model, which allowed to conclude that the stigmatization of mental health occurs, essentially, in the topics of Economics and Politics. The experimental results confirm the existence of stigma in Portuguese online newspapers (52% of the 978 articles collected) and the effectiveness of the use of Artificial Intelligence to detect it. Additionally, a set of 978 articles collected and manually annotated with the classes “stigmatizing” and “literal” is created and made available.
URI: http://hdl.handle.net/10773/35068
Appears in Collections:UA - Dissertações de mestrado
DETI - Dissertações de mestrado

Files in This Item:
File Description SizeFormat 
Documento_Alina_Yanchuk.pdf4.02 MBAdobe PDFView/Open


FacebookTwitterLinkedIn
Formato BibTex MendeleyEndnote Degois 

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.