Decision tree e geoestatística na redução do número de análises de micronutrientes do solo
Arquivos
Data
2024-02-23
Autores
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Viçosa
Resumo
Para realizar a interpolação por krigagem, é importante que cada ponto num semivariograma seja obtido com base no mínimo da combinação de 30 pares de pontos. Além disso, alguns autores alegam que é necessário ter pelo menos 100 amostras para fazer a interpolação. Sendo assim, o processo de amostragem se torna caro para o produtor rural. Como alternativa de contornar este problema de amostragem, foi utilizado metodologias de machine learning. O objetivo principal deste trabalho é avaliar o uso da metodologia de decision tree na redução do adensamento amostral para atributos do solo visando a realização da krigagem ordinária com tamanho amostral reduzido. Para isso, foi realizado 50 amostragem pelo algoritmo Latin Hypercube Sampling (LHS), com malhas contendo 82, 112 e 127 pontos amostrados e os valores faltantes foram preditos com decision tree, até completar 150 pontos e logo em seguida foi realizado a krigagem ordinária para as malhas 𝑀𝑅127, 𝑀𝑅112 e 𝑀𝑅82 , que foi gerado pela combinação das 50 predições por decision tree e avaliados os valores da Raiz Quadrada do Erro Médio (RMSE) e Média do Erro Absoluto (MAE), denominados RMSE_Krig e MAE_Krig. Foi percebido que há uma redução nestas estatísticas ao passo que aumentamos a redução amostral. A redução das estatísticas de validação indica que à medida que aumentamos a quantidade de amostras preditas com decision tree, há uma melhoria no modelo de krigagem ordinária. Ao fazer o mapa de atributos para as malhas reduzidas, é percebido que o padrão de concentração de nutrientes dos solos nas malhas reduzidas segue semelhante ao padrão original, ou seja, regiões com maiores concentrações ainda mantêm níveis elevados, enquanto aquelas com menores concentrações continuam a apresentar índices reduzidos. Ao fazer o mapa de atributos das malhas reduzidas é percebido que o padrão de concentração de micronutrientes dos solos nas malhas reduzidas segue semelhante ao padrão original, ou seja, zonas com maiores concentrações ainda continuam com concentrações elevadas e regiões com menores concentrações continuam com concentrações menores. Com isso, a decision tree, se mostrou eficiente em preservar o padrão de distribuição dos micronutrientes. Palavras-chave: Adensamento amostral; Aprendizado estatístico; Krigagem ordinária.
To perform kriging interpolation, it is important that each point in a semivariogram is obtained based on a minimum combination of 30 pairs of points. Additionally, some authors argue that at least 100 samples are necessary to conduct the interpolation. Therefore, the sampling process becomes expensive for the farmer. As an alternative to address this sampling issue, machine learning methodologies were employed. The main objective of this work is to evaluate the use of the decision tree methodology in reducing sample density for soil attributes, aiming to per- form ordinary kriging with a reduced sample size. For this purpose, 50 samplings were per- formed using the Latin Hypercube Sampling (LHS) algorithm, with grids containing 82, 112, and 127 sampled points, and the missing values were predicted with a decision tree until 150 points were completed. Ordinary kriging was then conducted for the grids 𝑀𝑅127, 𝑀𝑅112 and 𝑀𝑅82 , which were generated by combining the 50 predictions made by the decision tree, and the values of Root Mean Square Error (RMSE) and Mean Absolute Error (MAE), referred to as RMSE_Krig and MAE_Krig, were evaluated. It was observed that these statistics decrease as the sample reduction increases. The reduction in validation statistics indicates that as the number of samples predicted by the decision tree increases, there is an improvement in the ordinary kriging model. When creating the attribute map for the reduced grids, it is observed that the pattern of nutrient concentration in the soils of the reduced grids remains similar to the original pattern, meaning that regions with higher concentrations still maintain elevated levels, while those with lower concentrations continue to show reduced levels. Therefore, the decision tree proved to be effective in preserving the distribution pattern of micronutrients. Keywords: Sample density; Statistical learning; Ordinary kriging.
To perform kriging interpolation, it is important that each point in a semivariogram is obtained based on a minimum combination of 30 pairs of points. Additionally, some authors argue that at least 100 samples are necessary to conduct the interpolation. Therefore, the sampling process becomes expensive for the farmer. As an alternative to address this sampling issue, machine learning methodologies were employed. The main objective of this work is to evaluate the use of the decision tree methodology in reducing sample density for soil attributes, aiming to per- form ordinary kriging with a reduced sample size. For this purpose, 50 samplings were per- formed using the Latin Hypercube Sampling (LHS) algorithm, with grids containing 82, 112, and 127 sampled points, and the missing values were predicted with a decision tree until 150 points were completed. Ordinary kriging was then conducted for the grids 𝑀𝑅127, 𝑀𝑅112 and 𝑀𝑅82 , which were generated by combining the 50 predictions made by the decision tree, and the values of Root Mean Square Error (RMSE) and Mean Absolute Error (MAE), referred to as RMSE_Krig and MAE_Krig, were evaluated. It was observed that these statistics decrease as the sample reduction increases. The reduction in validation statistics indicates that as the number of samples predicted by the decision tree increases, there is an improvement in the ordinary kriging model. When creating the attribute map for the reduced grids, it is observed that the pattern of nutrient concentration in the soils of the reduced grids remains similar to the original pattern, meaning that regions with higher concentrations still maintain elevated levels, while those with lower concentrations continue to show reduced levels. Therefore, the decision tree proved to be effective in preserving the distribution pattern of micronutrients. Keywords: Sample density; Statistical learning; Ordinary kriging.
Descrição
Palavras-chave
Árvores de decisão, Amostragem (Estatística), Aprendizado do computador, Krigagem
Citação
BATISTA, Luciano Gonçalves. Decision tree e geoestatística na redução do número de análises de micronutrientes do solo. 2024. 48 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa. 2024.