Please use this identifier to cite or link to this item: http://hdl.handle.net/10773/40002
Title: Aplicação de técnicas de aprendizagem automática para analisar a síntese de materiais lamelares nanoestruturados
Author: Martins, Gabriel Luís Silva
Advisor: Galvão, Tiago
Tedim, João
Rocha, Claudia
Keywords: Hidróxidos duplos lamelares
Intercalação
Inibidores de corrosão
Corantes
Fármacos
Difração de raios-X
Aprendizagem automática
Florestas aleatórias
Validação-cruzada
Descritores
Defense Date: 28-Nov-2023
Abstract: Os hidróxidos duplos lamelares (HDL) pertencem a uma classe de materiais nanoestruturados sintéticos capazes de realizar troca iónica, que podem ser sintetizados de maneira relativamente barata, sendo estes materiais potencialmente recicláveis. Estes materiais são produzidos a nível industrial pela empresa Smallmatek, Lda. (SMT) e permitem o armazenamento e libertação controlada dos compostos intercalados, consoante a variação das condições do meio externo, permitindo dar diferentes funcionalidades quando incluídos como aditivos nanoestruturados em revestimentos. Desta forma, a aplicação de técnicas de Aprendizagem Automática (AA) aos resultados experimentalmente obtidos permitirá à empresa minimizar o tempo e recursos financeiros necessários para o desenvolvimento de novos produtos, como, por exemplos, HDL capazes de intercalar inibidores de corrosão, biocidas/antimicrobianos, sensores, antocianinas, fármacos e/ou tensoativos. Neste contexto, o principal objetivo deste trabalho foi prever se um determinado composto pode ser intercalado em HDL. Para tal, foi necessário obter e organizar o maior número de dados possível, considerando os dados obtidos, anteriormente na UA e na SMT. Recorrendo a uma linguagem de programação de código aberto (Python), com este conjunto de dados foi possível obter um modelo de florestas aleatórias que considera diferentes tipos de condições experimentais. Após o tratamento de dados, utilizou-se o método de eliminação recursiva de descritores para remover iterativamente descritores menos importantes, criando um subconjunto de descritores que maximiza a métrica estatística selecionada. Deste modo, para validar a seleção de descritores efetuada pelo método de eliminação recursiva de descritores, foi realizada a validação cruzada. É importante avaliar a confiabilidade das próprias métricas de avaliação dos modelos de AA. Esta é um fator importante, pois pode ajudar a encontrar erros na avaliação e interpretação dos resultados. Assim, o valor de Kappa permite testar a confiabilidade das métricas estatísticas para avaliar o modelo. O coeficiente de correlação de Matthews, tal como o valor de Kappa, permite avaliar a confiabilidade do modelo, sendo a sua interpretação semelhante ao valor de Kappa. Através dos resultados obtidos recorrendo à validação cruzada usando os descritores selecionados, verifica-se que a exatidão, exatidão balanceada, sensibilidade e precisão, estão todos acima de 70 %, o que já permite prever corretamente a maioria das sínteses. Para o teste final foi possível verificar que os resultados apontam para uma melhoria de todos os parâmetros, exceto para a sensibilidade, provando-se, desta forma, que o modelo teve um bom desempenho para novos dados, e que nunca foram usados na escolha dos descritores e otimização dos seus parâmetros.
Layered double hydroxides (LDHs) belong to a class of synthetic nanostructured materials capable of performing ion exchange, which can be synthesized in a relatively cheap and potentially recyclable way. These materials are produced at an industrial level by the company SMT and can store and release in a controlled way the intercalated compounds, depending on changes in external environmental conditions, providing different functionalities when included as nanostructured additives in coatings, for example. In this way, applying Machine Learning techniques to the results experimentally obtained will allow the company to minimize the time and financial resources needed to develop new products, such as corrosion inhibitors, biocides/antimicrobials, sensors, anthocyanins, drugs and/or surfactants. In. this context, the main objective of the present work was to predict whether a given compound can be intercalated in LDHs. To achieve this, it was necessary to obtain and organize as much data as possible, considering data obtained experimentally, both in this work and in previous ones, by UA and SMT. In this way, a large amount of data allowed us to obtain a more assertive and reliable model. With this data set, it was possible to obtain a random forest model that considers different types of experimental conditions, using an open-source programming language (Python), which could enable the construction of applications in future work. After data processing, the recursive descriptor elimination method was used to iteratively remove less important descriptors, creating a subset of descriptors that maximizes the selected statistical metric. To validate the selection of descriptors carried out by recursive feature elimination method, cross-validation was performed. It is important to assess the reliability of AA models' own evaluation metrics. This is an important factor as it can help to find errors in the evaluation and interpretation of results. Thus, the Kappa value allows testing the reliability of statistical metrics to evaluate the model. The Matthews correlation coefficient, like the Kappa value, allows the reliability of the model to be assessed, with its interpretation being similar to the Kappa value. Through the values obtained with cross-validation with the selected descriptors, it can be seen that the accuracy, balanced accuracy, sensitivity and precision are all above 70%, which already allows the majority of synthesis to be correctly predicted. For the final test, it was possible to verify that the results point to an improvement in all parameters, except sensitivity, thus proving that the model performed well for new data, and that they were never used in the choice of descriptors and optimization of their parameters.
URI: http://hdl.handle.net/10773/40002
Appears in Collections:UA - Dissertações de mestrado
DEMaC - Dissertações de mestrado

Files in This Item:
File Description SizeFormat 
Documento_Gabriel_Martins.pdf1.67 MBAdobe PDFView/Open


FacebookTwitterLinkedIn
Formato BibTex MendeleyEndnote Degois 

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.