El manglar es uno de los ecosistemas marinos más ricos en biodiversidad y productividad, y la clasificación fina de comunidades de manglares mediante el uso de imágenes de alta resolución y el aprendizaje profundo ha sido un tema candente y difícil en la investigación actual. Este artículo propone un nuevo modelo de red de clasificación de aprendizaje profundo SSAFormer (Swin-Segmentation-Atrous-Transformer) basado en el mecanismo de atención de ventana y el espacio poroso para clasificar finamente las comunidades de manglar. Este modelo se basa en el transformador Swin como red principal en la red neural de agrupación profunda, y se han añadido una red neuronal convolucional (CNN) y una pirámide de agrandamiento espacial poroso (ASPP) a la red neural principal para extraer información de características a más escalas. Se ha incorporado una estructura de la pirámide de características (FPN) al decodificador ligero para fusionar información rica en características semánticas de niveles bajos y altos. Este artículo utiliza datos de sensores remotos activos y pasivos del satélite Gaofen-7 (GF-7) y la nube de puntos LiDAR de UAV para construir tres conjuntos de datos, y compara y analiza los resultados de clasificación de SegFormer y el algoritmo Swin Transformer mejorado en esta investigación, demostrando aún más el rendimiento de la Clasificación SSAFormer en comunidades de manglar. Los resultados indican que (1) SSAFormer logra una clasificación fina de manglar, con un aumento de hasta un 5.30% en la precisión general Kappa 0.8952 y un aumento máximo del coeficiente de intersección promedio (MIoU) del 7.68% en comparación con SegFormer; (2) En el conjunto de datos de espectro múltiple (GF-7), SSAFormer logró la mayor precisión general (OA) del 91%, en el conjunto de datos LiDAR UAV, el MIoU se incrementó al 57.68%, y al agregar características espectrales al conjunto de datos LiDAR UAV, el MIoU promedio para SSAFormer se incrementó en un 1.48%; (3) La nube de puntos de LiDAR en comparación con el conjunto de datos de espectro múltiple aumentó el MIoU promedio en un 5.35%, aumentó la precisión general (OA) en un 1.81%, y la precisión de clasificación de datos de LiDAR que incluyen características espectrales (F1-score) aumentó un 2.6%; (4) Este estudio propone que el algoritmo SSAFormer logra una precisión de clasificación máxima del 97.07% para el manglar, la clasificación máxima del árbol de lirio alcanza el 91.99%, y la precisión F1-score para la hierba de arroz alcanza el 93.64%, con un promedio de precisión F1-score para el árbol de lirio en el modelo SSAFormer de hasta 86.91%. El algoritmo SSAFormer propuesto por este estudio logra mejorar con éxito la precisión de clasificación de comunidades de manglar.
关键词
Sensor remoto; Manglares; GF-7 espectro múltiple; Nube de puntos UAV LiDAR; SSAFormer; Aprendizaje profundo; Integración de imágenes activas y pasivas; Selección de características; Clasificación fina de comunidades