Anonimização baseada em k-anonimato para garantir a privacidade de dados em internet das coisas aplicada na saúde
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Universidade Federal de Viçosa
Abstract
O avanço acelerado da microeletrônica e a popularização de dispositivos da Internet das Coisas (IoT) aplicados à área da saúde (IoHT) têm impulsionado a coleta, o armazenamento e a transmissão de grandes volumes de dados sensíveis, como informações clínicas e pessoais. Embora tais dados sejam essenciais para viabilizar monitoramentos, diagnósticos e decisões médicas mais precisas, sua manipulação inadequada pode expor pacientes a riscos significativos de privacidade, resultando em violações legais e prejuízos éticos. Nesse cenário, torna-se crucial desenvolver soluções que conciliem a proteção da privacidade em conformidade com as legislações vigentes, preservando simultaneamente a utilidade dos dados, mesmo em ambientes distribuídos e heterogêneos característicos da IoHT. Para enfrentar esses desafios, esta tese propõe um framework abrangente para realizar k- anonimização de dados, fundamentado na abordagem de generalização antecipada e no agrupamento de k-membros. O framework Generalization First k-Member Clustering (GFKMC) aplica, paralelamente, a anonimização dinâmica por separatrizes a quase identificadores numéricos e a generalização hierárquica a quase identificadores categóricos. Posteriormente, para atender aos requisitos do k- anonimato, é aplicado um procedimento de reagrupamento eficiente. Os resultados demonstram a eficácia do framework GFKMC quanto à utilidade dos dados, apresentando uma perda constante de informação, em torno de 21%, para diversos valores de k, superando os métodos tradicionais em cenários que exigem níveis mais elevados de privacidade. Simultaneamente, o GFKMC garante forte proteção da privacidade ao reduzir o risco de reidentificação individual. Além disso, o GFKMC comprova sua robustez quando aplicado a modelos de aprendizado de máquina, apresentando degradação mínima nas métricas de desempenho. Essas evidências demonstram que o GFKMC equilibra de forma eficiente o compromisso entre privacidade e utilidade dos dados, tornando-o uma ferramenta valiosa para aplicação prática em ambientes IoHT. Palavras-chave: privacidade de dados; anonimização de dados; k-anonimato; aprendizado federado; ferramenta de gerenciamento de segurança; aprendizado de máquina; IoHT; IoT
The rapid advancement of microelectronics and the popularization of Internet of Healthcare Things (IoHT) devices have driven the collection, storage, and transmission of large volumes of sensitive data, such as clinical and personal information. While such data is essential for enabling more accurate monitoring, diagnosis, and medical decision-making, its improper handling can expose patients to significant privacy risks, resulting in legal violations and ethical harm. In this scenario, it is crucial to develop solutions that balance privacy protection in compliance with current legislation, while preserving data utility even in distributed and heterogeneous environments typical of the IoHT. To address these challenges, this thesis proposes a comprehensive framework for performing k-anonymization based on generalization first and k-member clustering. The Generalization First k-Member Clustering (GFKMC) framework applies dynamic anonymization by separatrices to numerical quasi-identifiers and hierarchical generalization to categorical quasi-identifiers. Subsequently, to meet the k-anonymity requirements, an efficient reclustering procedure is applied. The results demonstrate the effectiveness of the GFKMC framework in terms of data utility, yielding a consistent information loss of around 21% for various k values, outperforming traditional methods in scenarios where higher levels of privacy are required. Simultaneously, GFKMC ensures strong privacy by reducing the risk of individual re-identification. Furthermore, GFKMC proves its robustness when applied to machine learning models, achieving minimal degradation in performance metrics. These findings show that GFKMC effectively balances the trade-off between privacy and data utility, making it a valuable tool for practical application in IoHT environments. Keywords: data privacy; data anonymization; k-anonymity; federated Learning; security management tool; machine learning; IoHT; IoT
The rapid advancement of microelectronics and the popularization of Internet of Healthcare Things (IoHT) devices have driven the collection, storage, and transmission of large volumes of sensitive data, such as clinical and personal information. While such data is essential for enabling more accurate monitoring, diagnosis, and medical decision-making, its improper handling can expose patients to significant privacy risks, resulting in legal violations and ethical harm. In this scenario, it is crucial to develop solutions that balance privacy protection in compliance with current legislation, while preserving data utility even in distributed and heterogeneous environments typical of the IoHT. To address these challenges, this thesis proposes a comprehensive framework for performing k-anonymization based on generalization first and k-member clustering. The Generalization First k-Member Clustering (GFKMC) framework applies dynamic anonymization by separatrices to numerical quasi-identifiers and hierarchical generalization to categorical quasi-identifiers. Subsequently, to meet the k-anonymity requirements, an efficient reclustering procedure is applied. The results demonstrate the effectiveness of the GFKMC framework in terms of data utility, yielding a consistent information loss of around 21% for various k values, outperforming traditional methods in scenarios where higher levels of privacy are required. Simultaneously, GFKMC ensures strong privacy by reducing the risk of individual re-identification. Furthermore, GFKMC proves its robustness when applied to machine learning models, achieving minimal degradation in performance metrics. These findings show that GFKMC effectively balances the trade-off between privacy and data utility, making it a valuable tool for practical application in IoHT environments. Keywords: data privacy; data anonymization; k-anonymity; federated Learning; security management tool; machine learning; IoHT; IoT
Description
Citation
COELHO, Kristtopher Kayo. Anonimização baseada em k-anonimato para garantir a privacidade de dados em internet das coisas aplicada na saúde. 2025. 89 f. Tese (Doutorado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2025.
