Combining UAV-LiDAR point clouds and SSAFormer algorithms for fine classification of mangrove communities

ZHANG Shurong ,  

FU Bolin ,  

GAO Ertao ,  

JIA Mingming ,  

SUN Weiwei ,  

WU Yan ,  

ZHOU Guoqing ,  

摘要

Мангровые леса - одна из самых разнообразных и высокопродуктивных морских экосистем, и точная классификация мангровых сообществ при помощи высокоразрешающих спутниковых изображений и глубокого обучения стала одной из важных и сложных задач современных исследований. В данной статье предлагается новая модель глубокого обучения для точной классификации мангровых сообществ на основе визуального трансформера SSAFormer (Swin-Segmentation-Atrous-Transformer) с использованием механизма внимания к окнам и атрастического трансформера пространства. Эта модель основана на варианте визуального трансформатора Swin Transformer, в основную сеть которого добавлены сверточная нейронная сеть (CNN) и атрастическая пространственная пирамида свертки ASPP (Atrous Spatial Pyramid Pooling) для извлечения более масштабированных признаков, а в легком весовом декодере встроена фрагментированная структура пирамиды признаков (FPN) для объединения богатой семантической информации низкого и высокого уровня. Мы использовали спутниковые мультиканальные изображения Gao fen-7 (GF-7) и беспилотники радиолокационного дальностомера (UAV-LiDAR) для построения трех наборов данных дистанционного зондирования, и проанализировали и сравнили результаты классификации модели SegFormer и улучшенной в нашем исследовании модели Swin Transformer, демонстрируя дальнейшую эффективность алгоритма SSAFormer в классификации мангровых сообществ. Результаты показывают, что (1) по сравнению с SegFormer, SSAFormer достигает точной классификации мангровых лесов, общий показатель точности OA (Overall Accuracy) улучшился на 1,77% - 5,30%, максимальный коэффициент Каппы достиг 0,8952, средняя пересечение объединения пользователей MIoU (Mean Intersection over Union) увеличилась на 7,68%; (2) в наборе данных мультиканального спутника GF-7, алгоритм SSAFormer достигает самой высокой общей точности OA 91%, на наборе данных UAV-LiDAR увеличилась MIoU до 57,68%, на наборе данных UAV-LiDAR с включенной спектральной особенностью, средняя miouf, полученная алгоритмом SSAFormer, улучшилась на 1,48%; (3) в сравнении с мультиканальными данными наборов данных для удаленного зондирования UAV-LiDAR, средняя пользовательская пересечение объединения miouf увеличилась на 5,35%, средний коэффициент общей точности OA улучшился на 1,81%, точность классификации (F1-score) на наборах данных UAV-LiDAR с включенной спектральной особенностью увеличилась на 2.6%; (4) алгоритм SSAFormer, предложенный в этом исследовании, позволяет достичь самой высокой точности классификации (F1-score) для мангровых деревьев 97,07%, для деревьев Tonghua до 91,99%, для зарастания курзи 93,64%, средние оценки F1-score для дерева Tonghua достопримечательно растут в модели SSAFormer и достигают 86,91% высоты. Предложенный в этом исследовании алгоритм SSAFormer позволяет значительно повысить точность классификации мангровых сообществ.

关键词

remote sensing;mangrove;GF-7 multispectral;UAV-LiDAR point clouds;SSAFormer;deep learning;Active and passive image combination;feature selection;Fine classification of community

阅读全文