Please use this identifier to cite or link to this item: http://hdl.handle.net/10773/41062
Title: Machine learning algorithms for fuel consumption prediction: a comparative study
Other Titles: Algoritmos de aprendizagem automática para previsão de consumo de combustível: um estudo comparativo
Author: Carvalho, Alexandra Teixeira de Sousa Marques de
Advisor: Matos, Sérgio Guilherme Aleixo de
Viguier, Clément
Keywords: Road freight
Fuel consumption estimation
Predictive machine-learning algorithms
Linear regression
Decision tree
Ensemble methods
Random forest
GXBoost
Multilayer perceptron
Defense Date: 13-Jul-2023
Abstract: Road freight, albeit commonly used, imposes serious monetary, societal and environmental impacts, which can be mitigated through the digitalisation of road fleet management operations. To this end, fuel consumption estimation is a crucial, but challenging, task, due to the complex and dynamic nature of fuel consumption data. The present dissertation proposed a comparative study of multiple machinelearning- based approaches as alternatives to the current simulation solution at Meight Technologies, S.A.. The proposal is based on the hypothesis that the simulation does not perform at its theoretical best. A study to decompose the error found in the simulation’s fuel consumption estimation not only corroborated the gap between the current and theoretical best simulation results but also showed a persisting significant error in the simulation, even in the theoretical best scenario, which suggested that the improvement of these results can be attained by using a different model altogether instead of improving partial values and steps. This was the basis for the comparative analysis performed, which gathered the performance of a baseline linear regression model, a decision tree, with two ensemble variants, namely the random forest algorithm and the GXBoost, and a custom multilayer perceptron-based architecture preceded with a convolutional layer proposed in this dissertation. The models were validated by comparing their results with the performance of the existing simulation and also among them, using two error metrics. To mitigate the impact of individual idiosyncrasies of driving behaviour, a first experiment consisted in training a driver-specific model for each driver. While the custom multilayer perceptron-based model preceded by a convolutional layer showed an improvement from the simulation’s predictions and from the baseline linear regression, the decision tree regressor achieved a higher level of goodness of fit, especially in the ensemble setting, with the random forest algorithm. A second experiment, similar to the first, introduces the velocity as an input, to quantify the impact of the speed profile on the model’s performance. Results from the ensemble models present the lowest percentual error between the three experiments, due to having built-in mechanisms for feature selection and, therefore, being better equipped to automatically assign importance to each feature based on its contribution to the prediction task. Finally, the last experiment aims at understanding each model’s generalisation capabilities. This is a difficult case, as the driving behaviours are complex patterns that vary across drivers, and they are not easily inferred from the road characteristics. The results of this research aim to contribute to the understanding of the implications of each algorithm’s application in the context of fuel consumption estimation.
O transporte rodoviário de mercadorias, embora comum, impõe sérios impactos monetários, sociais e ambientais, que podem ser mitigados através da digitalização das operações de gestão da frota rodoviária. Nesse sentido, a estimativa do consumo de combustível é uma tarefa crucial, porém desafiadora, devido à natureza complexa e dinâmica dos dados de consumo de combustível. A dissertação propôs um estudo comparativo de abordagens baseadas em aprendizagem automática« como alternativas à solução de simulação atual na Meight Technologies, S.A. A proposta baseia-se na hipótese de que a simulação não alcança seu melhor desempenho teórico. Um estudo para decompor o erro encontrado na estimativa de consumo de combustível da simulação não SÓ corroborou a diferença entre os resultados atuais e os da melhor simulação teórica, mas também mostrou um erro significativo persistente na simulação, mesmo no cenário teoricamente melhor, sugerindo que a melhoria desses resultados pode ser alcançada usando um modelo diferente em vez de aprimorar valores e etapas parciais. Isso serviu como base para a análise comparativa realizada, que reuniu o desempenho de um modelo de regressão linear para referência, uma árvore de decisão, com duas variantes de conjunto, nomeadamente o algoritmo de floresta aleatória e o GXBoost, e uma arquitetura personalizada baseada numa perceptron multicamada precedida por uma camada convolucional proposta nesta dissertação. Os modelos foram validados comparando os seus resultados com o desempenho da simulação existente e também os resultados entre si, usando duas métricas de erro. Para mitigar o impacto das idiossincrasias individuais do comportamento do condutor, uma primeira experiência consistiu em treinar um modelo específico para cada condutor. Embora o modelo baseado na perceptron multicamada personalizado precedido por uma camada convolucional tenha apresentado uma melhoria em relação às previsões da simulação e à regressão linear de referência, o regressor de árvore de decisão alcançou um nível mais alto de ajuste, especialmente na configuração de conjunto, com o algoritmo de floresta aleatória. Uma segunda experiência, semelhante à primeira, alimenta também aos modelos a velocidade do veículo a cada ponto, a fim de quantificar o impacto do perfil de velocidade no desempenho do modelo. Os resultados dos modelos de conjunto apresentam o menor erro percentual entre as três experiências, devido a mecanismos incorporados de seleção de características e, portanto, estão mais bem equipados para atribuir automaticamente um valor de importância a cada característica com base na sua contribuição para a tarefa. Por fim, a última experiência visa entender as capacidades de generalização de cada modelo. Esse é um caso difícil, pois os comportamentos do condutor são padrões complexos e únicos e não são facilmente inferidos a partir das características da estrada. Os resultados desta pesquisa visam contribuir para a compreensão das implicações da aplicação de cada algoritmo no contexto da estimativa de consumo de combustível.
URI: http://hdl.handle.net/10773/41062
Appears in Collections:UA - Dissertações de mestrado
DETI - Dissertações de mestrado
DMat - Dissertações de mestrado

Files in This Item:
File Description SizeFormat 
Documento_Alexandra_Carvalho.pdf6.12 MBAdobe PDFembargoedAccess


FacebookTwitterLinkedIn
Formato BibTex MendeleyEndnote Degois 

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.