Исследование оценки расхода реки на основе Sentinel-2 и машинного обучения — на примере гидрологической станции Тан Най Хай

YIN Wenjie ,  

WANG Xuelei ,  

WANG Chen ,  

WANG Hang ,  

HUANG Caisheng ,  

ZHAO Ruixue ,  

MENG Fanle ,  

LIU Jinxiu ,  

摘要

Расход рек является ключевой переменной в гидрологическом цикле и имеет важное значение для предупреждения о наводнениях, управления водными ресурсами и экологического мониторинга. В данной работе выбрана гидрологическая станция Тан Най Хай в верховьях реки Хуанхэ в качестве пилотного участка, предложена технология мониторинга расхода рек, объединяющая спутниковое дистанционное зондирование и методы машинного обучения. Сначала с помощью спутниковых изображений Sentinel-2 был извлечён ширина водной поверхности реки, а данные о метеорологических и гидрологических переменных (испарение, влажность почвы, температура, запас наземной воды и сток), смоделированные глобальной системой ассимиляции данных, использовались как шесть факторов влияния. Созданы модели мониторинга расхода на основе четырёх статистических методов (линейная функция, степенная функция, экспоненциальная функция и полиномиальная функция) и четырёх методов машинного обучения (XGBoost, случайный лес, LightGBM и CatBoost). Оценены различия в результатах моделей и с использованием SHAP (Shapley Additive Explanations) количественно определена важность влияния различных факторов. Результаты показывают, что среди четырёх статистических методов полиномиальная модель показала лучшие результаты в тестовом периоде. По сравнению с традиционными статистическими методами, методы машинного обучения продемонстрировали значительные преимущества в точности и стабильности: коэффициент детерминации (R2) повысился на 46.15%, а среднеквадратичная ошибка (RMSE) и средняя абсолютная ошибка (MAE) снизились на 54.61% и 55.65% соответственно. Модель случайного леса показала лучшие результаты моделирования среди четырех моделей в тестовом периоде, с R2, NSE, RMSE и MAE, равными 0.96, 0.89, 172.81 м³/с и 147.33 м³/с соответственно. Метод SHAP показал, что ширина водной поверхности имеет наибольший вклад в модель мониторинга расхода (189.02), за ней следуют влажность почвы (145.11) и температура (97.41). Данное исследование подтверждает возможность и преимущества объединения спутникового дистанционного зондирования и машинного обучения для высокоточного оценки расхода в сложных рельефных и слабо обеспеченных данными районах.

关键词

спутниковое дистанционное зондирование;машинное обучение;статистические модели;метод SHAP;мониторинг расхода;гидрологическая станция Тан Най Хай

阅读全文