GAC特徴選択およびAST回帰アルゴリズムに基づく森林地上炭素貯留量のリモートセンシング反演

SUN Kaiping ,  

ZHANG Jialong ,  

TENG Chenkai ,  

YANG Kun ,  

HUANG Kai ,  

LEI QiWang ,  

XIONG Dengliang ,  

摘要

単一の機械学習アルゴリズムではデータ内の潜在情報を十分に抽出できないため、本研究では森林の地上炭素貯留量(Aboveground Carbon Stock、AGC)の推定の安定性と精度を向上させるために、AST回帰アルゴリズム(AdaBoost–Stacking Tree-based、AST)を提案した。研究対象は雲南省シャングリラ地域の高山松であり、森林資源第二次調査データとLandsat 8 OLI画像を用いた。遺伝的アルゴリズムとCatBoostを融合した特徴選択手法(Genetic Algorithm and CatBoost、GAC)を構築し、再帰的特徴削除法(RFE)と比較してリモートセンシング変数の選定を行った。Hyperoptハイパーパラメータ最適化フレームワークを用いて各モデルのハイパーパラメータ調整を行い、アダプティブブースティング(AdaBoost)、CatBoost、ランダムフォレスト(RFR)、LightGBMの4つの単一機械学習回帰モデルをスタッキングしてAST回帰アルゴリズムを形成した。本アルゴリズムはベース学習器の平均融合とメタ学習器の適応的重み付けによりモデル最適化を実現する。6つの単一モデルとAST集成モデルの精度を比較し、最適モデルを用いて高山松炭素貯留量の反演および結果の不確実性マッピングを行った。結果は以下のとおりである:1)RFEは9つの変数を選択し、GACは7つの変数を選択し、そのうちGACで選択された7つの変数は高山松AGC反演精度により大きく寄与した;2)Hyperoptによる各モデルのハイパーパラメータ反復調整により、GACで選択された最適な特徴サブセットとASTアルゴリズムの組み合わせが最良の推定精度を獲得し、決定係数 R²=0.885、二乗平均平方根誤差 RMSE=8.321 t/hm²、予測精度 P=86.4%を示した;3)最適推定モデルに基づき、シャングリラ市の2016年の高山松地上炭素貯留量は770.953万トンであり、平均炭素密度は40.015 t/hm²であった。総じて、ASTアルゴリズムは複数回のクロスバリデーションにおいてより高い安定性と耐ノイズ性を示し、地域規模森林炭素貯留量反演に新たな視点と技術的支援を提供した。

关键词

炭素貯留量;Hyperoptハイパーパラメータ調整;機械学習;AST;高山松;GAC;リモートセンシング反演;不確実性解析

阅读全文