Inversion de la biomasse forestière aérienne basée sur la sélection des caractéristiques GAC et l'algorithme de régression AST

SUN Kaiping ,  

ZHANG Jialong ,  

TENG Chenkai ,  

YANG Kun ,  

HUANG Kai ,  

LEI QiWang ,  

XIONG Dengliang ,  

摘要

Étant donné qu'un seul algorithme d'apprentissage automatique ne peut pas exploiter pleinement les informations latentes dans les données, cette étude propose un algorithme de régression AST (AdaBoost–Stacking Tree-based, AST) afin d'améliorer la stabilité et la précision de l'estimation du stock de carbone aérien forestier (Aboveground Carbon Stock, AGC). La pin sylvestre de la région alpine de Shangri-La dans la province du Yunnan a été choisie comme objet d'étude. Les données de la deuxième enquête sur les ressources forestières et les images Landsat 8 OLI ont été utilisées pour construire une méthode de sélection de caractéristiques fusionnant un algorithme génétique et CatBoost (Genetic Algorithm and CatBoost, GAC), comparée à la méthode de suppression récursive des caractéristiques (RFE) pour le filtrage des variables de télédétection. Le cadre d'optimisation des hyperparamètres Hyperopt a été utilisé pour régler les hyperparamètres des modèles. Quatre modèles de régression d'apprentissage automatique individuels, à savoir AdaBoost, CatBoost, forêt aléatoire (RFR) et LightGBM, ont été empilés pour former l'algorithme de régression AST, qui optimise le modèle via une fusion en moyenne des apprenants de base et un poids adaptatif de l'apprenant méta. En comparant la précision de six modèles individuels et du modèle d'ensemble AST, le modèle optimal a été utilisé pour l'inversion du stock de carbone de la pin sylvestre et la cartographie de l'incertitude des résultats. Les résultats montrent : 1) RFE a sélectionné 9 variables, GAC en a sélectionné 7, avec une plus grande contribution des variables sélectionnées par GAC à la précision de l'inversion de l'AGC de la pin sylvestre ; 2) après ajustement itératif des hyperparamètres via Hyperopt, il a été constaté que le sous-ensemble optimal de caractéristiques sélectionné par GAC combiné à l'algorithme AST obtenait la meilleure précision d'estimation avec un coefficient de détermination R²=0,885, une RMSE de 8,321 t/hm², et une précision de prédiction P=86,4 % ; 3) sur la base du meilleur modèle d'estimation, le stock de carbone aérien de la pin sylvestre dans la ville de Shangri-La en 2016 était de 7 709 530 tonnes, avec une densité moyenne de carbone de 40,015 t/hm². En résumé, l'algorithme AST a montré une stabilité plus élevée et une meilleure résistance aux interférences lors de validations croisées multiples, fournissant de nouvelles idées et un soutien technique pour l'inversion du stock de carbone forestier à l'échelle régionale.

关键词

stock de carbone;optimisation des hyperparamètres Hyperopt;apprentissage automatique;AST;pin sylvestre;GAC;télédétection;analyse d'incertitude

阅读全文