Please use this identifier to cite or link to this item: http://hdl.handle.net/10773/32806
Title: Behaviour of COPD outcome measures over time and influence of the COVID-19 lockdown: comparison of fixed-effects selection methods
Other Titles: Comportamento temporal da DPOC e influência do confinamento imposto pela COVID-19: comparação de métodos de seleção de variáveis
Author: Cabral, Jorge Vaz Ramos Rodrigues de
Advisor: Afreixo, Vera Mónica Almeida
Marques, Alda Sofia Pires de Dias
Keywords: Chronic obstructive pulmonary disease
COVID-19
Feature selection
Linear mixed-effects models
Longitudinal data
Defense Date: 20-Jul-2021
Abstract: Modelling a certain outcome is challenging and it is common practice to collect several features in that attempt. Nevertheless, the appropriate statistical methods to select important and meaningful features are still unknown, namely under repeated measurements Longitudinal data can be grouped in forming trajectories that can be altered by countless factors, some of them unexpected. Identifying individuals’ outcome trajectories at early stage of illness, as well as potential risk factors should be of high priority since this knowledge can guide to the development of individually tailored treatment and result in effective interventions. Chronic obstructive pulmonary disease is a progressive and preventable disease and people with this disease could benefit from the identification of such risk factors and over time behaviour. In this dissertation we aimed to compare different feature selection methods based on regression algorithms, namely, random forest, Boruta, extreme gradient boosting, L-1 penalized estimation and automatic backward selection, adapted to longitudinal data. We also aimed to describe the effect of the Coronavirus disease 2019 lockdown on the one-minute sit-to-stand test, handgrip muscle strength and chronic obstructive pulmonary disease assessment test behaviour. We finally aimed to explore the factors influencing the behaviour of the one-minute sit-to-stand test over a six-month period in people with chronic obstructive pulmonary disease. We showed that the automatic backward elimination of features was consistent when it came to select statistically relevant features to be included in linear mixed-effects models with the lowest values of Akaike information criterion. The COVID-19 lockdown period seemed to have had no effect in the one-minute sit-to-stand test and handgrip muscle strength behaviour but a negative effect in the impact of the disease was observed. Also, an increase of the smoking load or age seems to lead to a worse evolution in the one-minute sit-to-stand test results over time in people with chronic obstructive pulmonary disease.
Modelar um determinado resultado é desafiante e recorre-se habitualmente à recolha de diversas variáveis. Contudo, desconhecem-se ainda os métodos estatísticos apropriados para a seleção de variáveis importantes e com significado, nomeadamente em dados longitudinais. Dados longitudinais podem ser agrupados e definem trajetórias alteráveis por inúmeros fatores, alguns deles inesperados. Identificar as trajetórias individuais de determinados resultados em fases iniciais de uma doença, bem como os potenciais fatores de risco, deveria ser prioritário uma vez que esse conhecimento pode conduzir ao desenvolvimento de tratamentos individualizados e resultar em intervenções efetivas. A doença pulmonar obstrutiva crónica é uma doença prevenível e progressiva e indivíduos com esta doença poderiam beneficiar com a identificação desses fatores de risco e do comportamento da doença ao longo do tempo. Esta dissertação teve como objetivos comparar diferentes métodos de seleção de variáveis, em dados longitudinais, baseados em algoritmos de regressão, nomeadamente, random forest, Boruta, extreme gradient boosting, estimação com penalização L-1 e eliminação automática. Também pretendemos descrever o efeito provocado pelo confinamento decorrente da pandemia de COVID-19 no teste de sentar e levantar em 1 minuto, na força de preensão manual e no teste de avaliação do impacto da doença pulmonar obstrutiva crónica. Finalmente, explorámos os fatores que influenciam o comportamento do teste de sentar e levantar em 1 minuto ao longo de seis meses em indivíduos com doença pulmonar obstrutiva crónica. O método de eliminação automática foi consistente na seleção de variáveis que produziram modelos lineares de efeitos mistos com menores valores de critério de informação de Akaike. O período de confinamento não teve efeito estatisticamente significativo no teste de sentar e levantar em 1 minuto nem na força de preensão manual. No entanto, foi observado um efeito negativo no impacto da doença. Foi também observada uma pior evolução dos resultados do teste de sentar e levantar em 1 minuto, ao longo do tempo, em indivíduos com doença pulmonar obstrutiva crónica mais velhos e com maior carga tabágica.
URI: http://hdl.handle.net/10773/32806
Appears in Collections:DCM - Dissertações de mestrado
UA - Dissertações de mestrado
DMat - Dissertações de mestrado

Files in This Item:
File Description SizeFormat 
Documento_Jorge_Cabral.pdf2.57 MBAdobe PDFView/Open


FacebookTwitterLinkedIn
Formato BibTex MendeleyEndnote Degois 

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.