Modelagem temporal e espacial da concentração superficial de sedimentos utilizando sensoriamento remoto orbital e aprendizado de máquina

Imagem de Miniatura

Data

2022-03-14

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Viçosa

Resumo

Entender a dinâmica da produção, transporte e deposição de sedimentos é de interesse em diversas áreas do conhecimento, pois a concentração de sedimentos em corpos hídricos é a principal causa de problemas relacionados com a qualidade da água, assoreamento de rios e reservatórios. No entanto, a medição em campo desta informação é bastante trabalhosa, o que dificulta a obtenção de bases de dados detalhadas e contínuas. Desta forma, o objetivo deste trabalho é modelar a variação temporal e espacial da concentração superficial de sedimentos (CSS) na bacia hidrográfica do rio Doce utilizando sensoriamento remoto orbital e modelos de aprendizado de máquina. A modelagem da CSS foi realizada a partir de duas metodologias distintas. A primeira abordou a utilização de sensoriamento remoto, em que foram utilizadas imagens orbitais dos sensores da contestação MultiSpectral Instrument (MSI)/Sentinel 2 e Operational Land Imager/(OLI) Landsat 8. Estabeleceu-se relação entre a refletância estimada pelos satélites com a CSS observada em campo medidas pela Agência Nacional de Águas e Saneamento (ANA) e pela Fundação Renova, por meio dos modelos regressão linear simples e múltipla (RLS e RLM), least absolute shrinkage and selection operator (LASSO) e elastic net. A segunda metodologia abordou a aplicação de modelos baseados em aprendizado de máquina, em que se utilizou dados históricos da medição da CSS realizada pela ANA em sete estações sedimentométricas instaladas ao longo da calha do rio Doce. Para a predição CSS foram utilizadas 62 variáveis preditoras derivadas das informações de declividade, pedologia, uso e cobertura da terra, precipitação, vazão fluvial, velocidade fluvial, evapotranspiração real, escoamento superficial, umidade do solo, temperatura e normalized difference vegetation index. Os seguintes algoritmos de aprendizado de máquina foram utilizados: random forest (RF), cubist, support vector machines (SVMs), extreme gradient boosting machine (XGboost) e regressão LASSO. Nas duas metodologias foram utilizadas a validação cruzada leave-one-out para o treinamento e testes dos modelos. As métricas adotadas para avaliação de desempenho foram erro médio absoluto (MAE), raiz do erro médio quadrático (RMSE), porcentagem do viés (PBIAS), coeficiente de Nash–Sutcliffe (NSE), índice de concordância de Willmot (d), coeficiente de determinação (R²), coeficiente de Kling-Gupta (KGE) e índice de eficiência (c). A banda do infravermelho próximo apresentou forte relação linear com a CSS, tanto utilizando o satélite MSI/Sentinel 2, quanto o OLI/Landsat 8. Dentre os modelos de regressão linear que utilizam múltiplas variáveis, a regressão linear múltipla, as regressões LASSO e Elastic Net apresentaram bom desempenho para a predição da CSS. Entretanto, a regressão LASSO e Elastitic Net facilitam na definição do conjunto ótimo de variáveis. Os mapas de fluxos de sedimentos indicam redução da CSS na calha do rio Doce em anos mais recentes, o que pode ser indicativo de que parte do material oriundo do rompimento da barragem de rejeitos de Fundão, em 2015, pode ter sido carreado pelos processos de ressuspensão e transporte de sedimentos. Bons resultados foram obtidos com a utilização de algoritmos de aprendizado de máquina para a predição da CSS na bacia hidrográfica do rio Doce, com destaque para os modelos cubist e XGBoost, que apresentaram o menor erro de predição e métricas de eficiência mais elevadas. As variáveis mais importantes para os modelos de predição se configuraram nas vazões fluviais diárias da data da coleta dos sedimentos e as vazões defasadas no tempo. A precipitação média diária acumulada também foi importante na modelagem dos sedimentos. A utilização dos modelos de aprendizado de máquina pode ser de grande auxílio para o monitoramento dos sedimentos, e servir como ferramenta para entender a dinâmica da produção de sedimentos na bacia hidrográfica do rio do Doce ao longo do tempo. Palavras-chave: Sentinel 2 e Landsat 8. Modelagem hidrossedimentológica. Aprendizado supervisionado. Barragem de rejeitos de Fundão.
The processes of sediment yield, transport, and deposition are fundamental for several areas of knowledge because sediment concentration causes problems related to water quality and silting of rivers and reservoirs. However, field measurement of sediment concentration is quite laborious, and therefore, obtaining detailed and continuous databases of this information is difficult. Thus, the aim of this study was to model the temporal and spatial variation of the superficial sediment concentration (SSC) in the Doce River Basin using orbital remote sensing and machine learning models. We used two different methodologies to predict SSC. The first included the application of remote sensing information, wherein we used orbital images from the multispectral instrument (MSI)/Sentinel 2 and the operational land imager (OLI)/Landsat 8. Simple and multiple linear regression models (SLR and MLR), least absolute shrinkage and selection operator (LASSO) regression, and elastic net regression were used to establish a relationship between the reflectance estimated by the satellites and the SSC measured in the field by the Agência Nacional de Águas e Saneamento Básico (ANA) and the Renova foundation. The second methodology involved the application of machine learning models using historical data of the SSC measurements monitored by the ANA at seven sediment gauge stations installed along the channel of the Doce River. Sixty-two predictor variables were used for SSC prediction derived from the following information: slope, pedology, land use and cover, precipitation, river streamflow, river velocity, actual evapotranspiration, surface runoff, soil moisture, temperature, and normalized difference vegetation index. The following machine- learning algorithms were used: random forest, cubist, support vector machines, extreme gradient boosting machine (XGBoost), and LASSO regression. In both methodologies, leave- one-out cross-validation was used to train and test the models. The metrics for performance evaluation were the mean absolute error, root mean square error, percentage of bias, Nash– Sutcliffe coefficient, Willmot agreement index, coefficient of determination), Kling–Gupta coefficient, and efficiency index. Using the MSI/Sentinel 2 and OLI/Landsat 8 satellites, the near-infrared band showed a strong linear relationship with SSC. Among the linear regression models that use multiple variables, both the MLR and LASSO and elastic net regressions performed well for SSC prediction. However, LASSO and elastic net best defined the optimal set of variables. The sediment flux maps indicated a reduction in SCC in the Doce River in recent years, which may indicate that part of the material from the rupture of the Fundão tailings dam may have been transported by resuspension and transport of sediment. Good results were obtained with the machine learning algorithms for SSC prediction in the Doce River Basin. The cubist and XGBoost models presented the lowest prediction error and high efficiency metrics. The most important variable for the prediction models was the daily streamflow on the date of the sediment samples. The average daily rainfall from rain gauge stations was also important for sediment modeling. The use of machine learning models can help sediment monitoring and serve as a great tool for understanding the dynamics of sediment yield in the Doce River Basin over time. Keywords: Sentinel 2 and Landsat 8. Sediments modeling. Supervised learning models. Fundão tailings dam.

Descrição

Palavras-chave

Sensoriamento remoto, Satélites artificiais - Sensoriamento remoto, Aprendizado do computador, Sedimentos fluviais, Barragens de rejeito - Doce, Rio, Bacia (MG e ES)

Citação

AIRES, Uilson Ricardo Venâncio. Modelagem temporal e espacial da concentração superficial de sedimentos utilizando sensoriamento remoto orbital e aprendizado de máquina. 2022. 114 f. Tese (Doutorado em Engenharia Agrícola) - Universidade Federal de Viçosa, Viçosa. 2022.

Avaliação

Revisão

Suplementado Por

Referenciado Por