Please use this identifier to cite or link to this item:
http://hdl.handle.net/10773/42950
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | Almeida, João Rafael Duarte de | pt_PT |
dc.contributor.advisor | Oliveira, José Luis Guimarães de | pt_PT |
dc.contributor.author | Reis, João António Assis | pt_PT |
dc.date.accessioned | 2024-11-28T15:19:47Z | - |
dc.date.available | 2024-11-28T15:19:47Z | - |
dc.date.issued | 2024-07-04 | - |
dc.identifier.uri | http://hdl.handle.net/10773/42950 | - |
dc.description.abstract | Real-world evidence in the medical domain refers to clinical evidence derived from real-world data analysis. This become possible due to current strategies to handle the database interoperability issues. As these strategies have been widely adopted, new challenges in data discovery have appeared. One of these challenges is the discovery of databases for specific health studies. Initially, this was handled using database catalogs and interfaces to compare database characteristics. However, these solutions become less effective as database networks expand. Aiming to improve the discovery of databases and simplify the execution of multicenter studies, this dissertation proposes a conversational query builder to assist medical researchers in efficiently finding the most suitable databases for their studies. The solution implements the BM25 technique for optimal database retrieval and uses a large language model (LLM) for text generation and natural language processing (NLP) tasks. The results demonstrate that the conversational query builder significantly improves the efficiency of database discovery, but more importantly, it simplifies the process of defining cohorts over observational databases. | pt_PT |
dc.description.abstract | A utilização e análise de dados médica em larga escala, permitiu que fosse possível realizar estudos com mais impacto. Isto tornou-se possível devido às estratégias atuais para lidar com os problemas de interoperabilidade de bases de dados. À medida que essas estratégias foram adotadas,novos desafios surgiram, nomeadamente relacionados com a descoberta de base de dados adequadas a cada estudo. Inicialmente, isso foi tratado utilizando catálogos de bases de dados e interfaces para comparar características das mesmas. No entanto, essas soluções tornaram-se menos eficazes devido à complexidade dos dados existentes. Com o objetivo de simplificar a identificação das bases de dados adequadas e simplificar a realização de estudos distribuídos, esta dissertação propõe um sistema conversacional de pesquisa para ajudar os investigadores médicos a encontrar de forma eficiente as bases de dados mais adequadas para os seus estudos. é constituída por um modelo BM25 para sugerir as bases de dados mais adequadas, e também utilizada um modelo de linguagem para geração e processamento de texto em linguagem natural. Os resultados demonstram que o sistema conversacional de pesquisa melhora significativamente a eficiência na descoberta de bases de dados e simplifica o processo de definição de estudos observacionais. | pt_PT |
dc.language.iso | eng | pt_PT |
dc.rights | openAccess | pt_PT |
dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | pt_PT |
dc.subject | Conversational query builder | pt_PT |
dc.subject | Biomedical data discovery | pt_PT |
dc.subject | LLM | pt_PT |
dc.subject | RAG | pt_PT |
dc.subject | EHDEN | pt_PT |
dc.subject | OHDSI | pt_PT |
dc.title | A conversational query builder on medical databases | pt_PT |
dc.title.alternative | Um sistema conversacional de pesquisa sobre bases de dados médicas | pt_PT |
dc.type | masterThesis | pt_PT |
thesis.degree.grantor | Universidade de Aveiro | pt_PT |
dc.description.master | Mestrado em Engenharia Informática | pt_PT |
Appears in Collections: | UA - Dissertações de mestrado DETI - Dissertações de mestrado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Documento_João_Reis.pdf | 9.38 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.