Explainable machine learning for effective alarm prediction

Abreu, Kalleb Morais de Moura

doi:https://doi.org/10.47328/ufvbbt.2024.242

Explainable machine learning for effective alarm prediction

Files

texto completo.pdf (1.93 MB)

Date

2023-12-20

Authors

Abreu, Kalleb Morais de Moura

Publisher

Universidade Federal de Viçosa

Abstract

This dissertation evaluates twelve machine learning models for the prediction of alarms using geographical clustering, leveraging data from an Italian company. The models encompass a spectrum of algorithms, including Naive Bayes (NB), XGBoost (XGB), and Multilayer Perceptron (MLP), coupled with encoding techniques such as Label/Ordinal Encoding (LOE) and Label/Ordinal/One-Hot Encoding (L2OE), and clustering method- ologies, namely Coopservice-2022 (COOP) and K-Means++ (KPP). XGB emerges as the most effective, yielding the highest AUC values across models. Adjustments in encoding methods show signiﬁcant improvements for NB and MLP, with a marginal impact for XGB. Hyperparameter tuning for XGB models reveals default values outper- form varied conﬁgurations. The SHAP value analyses emphasize the signiﬁcant impact of a speciﬁc cluster and hour of the day. Transfer learning experiments conﬁrm the model’s adaptability across Italian provinces, with continuous monitoring essential due to sensitivity to cluster labels. Challenges arise in handling dataset imbalances, impacting minority alarm class predictions. This work sets a foundation for further research on speciﬁc approaches for dealing with imbalanced datasets and one-class algorithms. The study advocates for ongoing validation across diverse provinces, emphasizing nuanced analyses and improvements in model robustness. Keywords: Alarms; Machine learning; Clustering; Explainable models; Transfer learning.
Esta dissertação avalia doze modelos de aprendizado de máquina para a previsão de alarmes utilizando agrupamento geográﬁco, por meio dados de uma empresa italiana. Os modelos abrangem uma variedade de algoritmos, incluindo Naive Bayes (NB), XGBoost (XGB) e Perceptron Multicamadas (MLP), combinados com técnicas de codiﬁcação como Label/Ordinal Encoding (LOE) e Label/Ordinal/One-Hot Encoding (L2OE), e metodologias de agrupamento, nomeadamente Coopservice-2022 (COOP) e K-Means++ (KPP). O XGB destaca-se como o mais eﬁcaz, proporcionando os maiores valores de AUC entre os modelos. Ajustes nas técnicas de codiﬁcação demonstram melhorias signiﬁcativas para NB e MLP, com um impacto marginal para o XGB. A otimização de hiperparâmetros para modelos XGB revela que os valores padrão superam conﬁgurações variadas. As análises de valores SHAP destacam a inﬂuência signiﬁcativa de atributos como um cluster especíﬁco e hora do dia. Experimentos de transferência de aprendizado conﬁrmam a adaptabilidade do modelo entre províncias italianas, ressaltando a necessidade de monitoramento contínuo devido à sensibilidade aos rótulos de cluster. Desaﬁos surgem ao lidar com desequilíbrios nos conjuntos de dados, impactando as previsões da classe minoritária de alarmes. Este trabalho estabelece uma base para futuras pesquisas sobre abordagens especíﬁcas para lidar com conjuntos de dados desequilibrados e algoritmos de uma única classe. O estudo advoga pela validação contínua em diversas províncias, enfatizando análises detalhadas e melhorias na robustez do modelo. Palavras-chave: Alarmes; Aprendizado de máquina; Agrupamento; Explicabilidade de modelos; Transferência de aprendizado.

Keywords

Aprendizado do computador, Alarmes, Análise por agrupamento, Modelos e construção de modelos

Citation

ABREU, Kalleb Morais de Moura. Explainable machine learning for effective alarm prediction. 2023. 65 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2023.

URI

https://locus.ufv.br/handle/123456789/32764

Collections

Ciência da Computação

Full item page

Explainable machine learning for effective alarm prediction

Files

Date

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Description

Keywords

Citation

URI

Collections

Endorsement

Review

Supplemented By

Referenced By