Los manglares son uno de los ecosistemas marinos con mayor biodiversidad y productividad, la clasificación detallada de las comunidades de manglares se ha convertido en un tema candente y difícil en la investigación actual, al integrar imágenes de alta resolución de teledetección y aprendizaje profundo. En este artículo se propone un nuevo modelo de red de clasificación de aprendizaje profundo, el Transformador de Atención Espacial en Diferentes Escalas de Swin (SSAFormer), para la clasificación detallada de comunidades de manglares. El modelo utiliza una variante del transformador visual Swin as the main network, incorporando una red neuronal convolucional (CNN) y una pirámide de convolución espacial atrés (ASPP) en la red principal para extraer mayor información de características a distintas escalas, e incrusta una estructura de pirámide de características (FPN) en el decodificador de peso ligero para fusionar información de características semánticas ricas de capas bajas y altas. Se construyeron tres conjuntos de datos de teledetección activa y pasiva utilizando imágenes multiespectrales del satélite GF-7 y nubes de puntos UAV-LiDAR, y se compararon y analizaron los resultados de clasificación de los algoritmos SegFormer y el Transformer de Swin mejorado en esta investigación, para demostrar aún más el rendimiento de clasificación del algoritmo SSAFormer en las comunidades de manglares. Los resultados muestran que: (1) en comparación con SegFormer, SSAFormer logra una clasificación detallada de manglares, con una mejora de la precisión general (OA) de 1.77% - 5.30%, el coeficiente Kappa alcanza hasta 0.8952, y la intersección media sobre la Unión (MIoU) se ha incrementado en un 7.68% en general; (2) en el conjunto de datos multiespectrales del GF-7, el algoritmo SSAFormer logra la mayor precisión total (OA) del 91%, en el conjunto de datos UAV-LiDAR, el MIoU del algoritmo SSAFormer se ha incrementado a un 57.68%, y en el conjunto de datos UAV-LiDAR que incluye características espectrales, el valor promedio de MIoU del algoritmo SSAFormer se ha incrementado en un 1.48%; (3) en comparación con el conjunto de datos multiespectrales del GF-7, el MIoU promedio de los datos UAV-LiDAR se ha incrementado en un 5.35%, el valor promedio de la precisión total (OA) ha aumentado en un 1.81%, y la precisión de clasificación de los datos UAV-LiDAR que incluyen características espectrales (F1-score) se ha incrementado en un 2.6%; (4) el algoritmo SSAFormer propuesto en esta investigación logra la mayor precisión de clasificación del Aegiceras corniculatum (F1-score) hasta un 97.07%, la precisión de clasificación de la Bruguiera gymnorhiza alcanza un 91.99%, y el F1-score del Spartina alterniflora alcanza un 93.64%, el valor promedio del F1-score del Bruguiera gymnorhiza en el modelo SSAFormer alcanza el 86.91% más alto. El algoritmo SSAFormer propuesto en esta investigación puede mejorar efectivamente la precisión de clasificación de las comunidades de manglares.
关键词
Teledetección;Manglar;GF-7 Multiespectral;Nube de puntos UAV-LiDAR;SSAFormer;Aprendizaje profundo;Integración de imágenes activas y pasivas;Selección de características;Clasificación detallada de comunidades