Inversão remota do estoque de carbono acima do solo florestal baseada na seleção de características GAC e algoritmo de regressão AST

SUN Kaiping ,  

ZHANG Jialong ,  

TENG Chenkai ,  

YANG Kun ,  

HUANG Kai ,  

LEI QiWang ,  

XIONG Dengliang ,  

摘要

Como um único algoritmo de aprendizado de máquina não pode explorar suficientemente as informações latentes nos dados, este estudo propõe um algoritmo de regressão AST (AdaBoost–Stacking Tree-based, AST) para melhorar a estabilidade e a precisão da estimativa do estoque de carbono acima do solo em florestas (Aboveground Carbon Stock, AGC). O pinheiro da região de Shangri-La na província de Yunnan foi escolhido como objeto de estudo. Foram utilizados dados da segunda pesquisa de recursos florestais e imagens do Landsat 8 OLI para construir um método de seleção de características que integra o algoritmo genético e o CatBoost (Genetic Algorithm and CatBoost, GAC), comparando com o método de eliminação recursiva de características (RFE) para a triagem de variáveis de sensoriamento remoto. A estrutura de otimização de hiperparâmetros Hyperopt foi usada para ajustar os hiperparâmetros de cada modelo. Quatro modelos individuais de regressão de aprendizado de máquina, a saber, AdaBoost, CatBoost, floresta aleatória (RFR) e LightGBM, foram empilhados para formar o algoritmo de regressão AST, que otimiza o modelo por meio da fusão média dos aprendizes base e do peso adaptativo do meta-aprendiz. Ao comparar a precisão de seis modelos individuais com o modelo ensemble AST, o modelo ótimo foi usado para a inversão do estoque de carbono do pinheiro e a criação de mapas de incerteza dos resultados. Os resultados indicam: 1) RFE selecionou 9 variáveis, GAC selecionou 7, sendo que as variáveis selecionadas por GAC contribuíram mais para a precisão da inversão de AGC do pinheiro; 2) com a otimização iterativa de hiperparâmetros baseada em Hyperopt, descobriu-se que o subconjunto ótimo de características selecionado pelo GAC combinado com o algoritmo AST obteve a melhor precisão de estimativa, com coeficiente de determinação R²=0,885, erro quadrático médio RMSE=8,321 t/hm² e precisão preditiva P=86,4%; 3) com base no modelo ótimo de estimativa, o estoque de carbono acima do solo do pinheiro na cidade de Shangri-La em 2016 foi de 7.709.530 toneladas, com densidade média de carbono de 40,015 t/hm². Em resumo, o algoritmo AST mostrou maior estabilidade e resistência a interferências sob múltiplas validações cruzadas, fornecendo novas ideias e suporte técnico para a inversão do estoque de carbono florestal em escala regional.

关键词

estoque de carbono;otimização de hiperparâmetros Hyperopt;aprendizado de máquina;AST;pinheiro;GAC;sensoriamento remoto;análise de incerteza

阅读全文