Estudo da estimativa do fluxo fluvial baseado em Sentinel-2 e aprendizado de máquina – Estudo de caso da estação hidrológica Tang Nai Hai

YIN Wenjie ,  

WANG Xuelei ,  

WANG Chen ,  

WANG Hang ,  

HUANG Caisheng ,  

ZHAO Ruixue ,  

MENG Fanle ,  

LIU Jinxiu ,  

摘要

O fluxo dos rios é uma variável chave no ciclo hidrológico e tem grande importância no alerta de enchentes, no gerenciamento dos recursos hídricos e na gestão ambiental ecológica. Esta tese seleciona a estação hidrológica Tang Nai Hai na região da nascente do Rio Amarelo como piloto e propõe uma técnica de monitoramento do fluxo do rio que integra sensoriamento remoto por satélite e aprendizado de máquina. Primeiro, foram extraídas as larguras da superfície da água do rio utilizando imagens de sensoriamento remoto Sentinel-2, e as variáveis meteorológicas e hidrológicas simuladas pelo sistema global de assimilação de dados terrestres (evapotranspiração, umidade do solo, temperatura, estoque de água terrestre e volume de escoamento) foram usadas como seis fatores motores. Modelos de monitoramento do fluxo foram construídos com base em quatro métodos estatísticos (função linear, função potência, função exponencial e função polinomial) e quatro métodos de aprendizado de máquina (XGBoost, Random Forest, LightGBM e CatBoost). Foram avaliadas as diferenças nos resultados dos modelos, e a importância dos diferentes fatores motores foi quantificada usando o método Shapley Additive Explanations (SHAP). Os resultados mostram que, entre os quatro métodos estatísticos, o modelo de função polinomial apresentou o melhor desempenho no período de teste; em comparação com os métodos estatísticos tradicionais, os métodos de aprendizado de máquina mostraram vantagens significativas em precisão e estabilidade, com o coeficiente de determinação (R2) aumentando 46,15%, e o erro quadrático médio (RMSE) e o erro absoluto médio (MAE) diminuindo 54,61% e 55,65%, respectivamente. O modelo Random Forest apresentou melhor desempenho de simulação no período de teste entre os quatro modelos, com R2, NSE, RMSE e MAE de 0,96, 0,89, 172,81 m³/s e 147,33 m³/s, respectivamente. O método SHAP indicou que a largura da superfície da água tem a contribuição mais significativa no modelo de monitoramento de fluxo (189,02), seguida pela umidade do solo (145,11) e temperatura (97,41). Este estudo confirma a viabilidade e superioridade da combinação de sensoriamento remoto por satélite e aprendizado de máquina para estimativas de fluxo de alta precisão em regiões com topografia complexa e escassez de dados.

关键词

sensoriamento remoto por satélite; aprendizado de máquina; modelos estatísticos; método SHAP; monitoramento de fluxo; estação hidrológica Tang Nai Hai

阅读全文