Étude d'estimation du débit fluvial basée sur Sentinel-2 et l'apprentissage automatique – cas de la station hydrologique Tang Nai Hai

YIN Wenjie ,  

WANG Xuelei ,  

WANG Chen ,  

WANG Hang ,  

HUANG Caisheng ,  

ZHAO Ruixue ,  

MENG Fanle ,  

LIU Jinxiu ,  

摘要

Le débit des rivières est une variable clé du cycle hydrologique et revêt une importance majeure dans les alertes aux inondations, la gestion des ressources en eau et la gestion de l'environnement écologique. Cette thèse sélectionne la station hydrologique Tang Nai Hai dans la région source du fleuve Jaune comme site pilote et propose une technique de surveillance du débit fluvial intégrant la télédétection satellite et l'apprentissage automatique. Tout d'abord, la largeur de la surface de l'eau du fleuve est extraite à l'aide des images Sentinel-2, et les variables météorologiques et hydrologiques simulées par le système mondial d'assimilation des données terrestres (évapotranspiration, humidité du sol, température, stockage d'eau terrestre et débit) sont utilisées comme six facteurs moteurs. Des modèles de surveillance du débit ont été construits en utilisant quatre méthodes statistiques (fonction linéaire, fonction puissance, fonction exponentielle et fonction polynomiale) ainsi que quatre méthodes d'apprentissage automatique (XGBoost, Random Forest, LightGBM et CatBoost). Les différences entre les résultats des modèles ont été évaluées et l'importance des différents facteurs moteurs a été quantifiée à l'aide de la méthode Shapley Additive Explanations (SHAP). Les résultats montrent que parmi les quatre méthodes statistiques, le modèle polynôme présente la meilleure performance pendant la période de test; comparativement aux méthodes statistiques traditionnelles, les méthodes d'apprentissage automatique montrent un avantage significatif en termes de précision et de stabilité, le coefficient de détermination (R2) a augmenté de 46,15%, tandis que la racine carrée de l'erreur quadratique moyenne (RMSE) et l'erreur absolue moyenne (MAE) ont diminué respectivement de 54,61% et 55,65%. Le modèle Random Forest montre la meilleure simulation parmi les quatre modèles pendant la période de test, avec R2, NSE, RMSE et MAE respectivement égaux à 0,96, 0,89, 172,81 m³/s et 147,33 m³/s. La méthode SHAP indique que la largeur de la surface de l'eau a la contribution la plus significative dans le modèle de surveillance du débit (189,02), suivie par l'humidité du sol (145,11) et la température (97,41). Cette étude confirme la faisabilité et la supériorité de la combinaison de la télédétection satellite et de l'apprentissage automatique pour l'estimation à haute précision du débit dans les régions à terrain complexe et aux données rares.

关键词

télédétection satellite;apprentissage automatique;modèles statistiques;methode SHAP;surveillance du débit;station hydrologique Tang Nai Hai

阅读全文