Les forêts de mangroves sont l’un des écosystèmes marins les plus diversifiés et les plus productifs, et la classification précise des communautés de mangroves à l’aide d’images satellitaires à haute résolution et de l’apprentissage en profondeur est devenue l’un des principaux sujets de recherche difficiles des les études contemporaines. Cet article propose un nouveau modèle d’apprentissage en profondeur pour la classification précise des communautés de mangroves en utilisant un transformateur visuel SSAFormer (Swin-Segmentation-Atrous-Transformer) qui utilise un mécanisme d’attention aux fenêtres et un transformateur spatial atroumique. Ce modèle est basé sur une variante du transformateur visuel Swin Transformer, auquel a été ajouté un réseau neuronal convolutif (CNN) et un comblement spatial pyramidal asphériquetique (ASPP) pour extraire des informations sur les caractéristiques à plus d’échelles, et un décodeur de faible poids a été incorporé avec une structure pyramidale de caractéristiques (FPN) pour fusionner des informations sémantiques riches des couches basses et hautes. Nous avons utilisé des images multiespectrales satellite Gao fen-7 (GF-7) et des données de nuages LIDAR sans pilote (UAV-LiDAR) pour construire trois ensembles de données de télédétection, et nous avons analysé et comparé les résultats de classification du modèle SegFormer et du modèle Swin Transformer amélioré dans notre étude, démontrant en outre l'efficacité de l’algorithme SSAFormer dans la classification des communautés de mangroves. Les résultats montrent que (1) par rapport à SegFormer, SSAFormer a atteint une classification précise des mangroves, la précision globale OA (Overall Accuracy) a augmenté de 1,77% à 5,30%, le coefficient kappa maximum était de 0,8952, et l'intersection moyenne sur union MIoU (Mean Intersection over Union) a augmenté de 7,68%; (2) dans le jeu de données multispectrales satellite GF-7, l’algorithme SSAFormer a atteint un maximum de précision globale OA de 91%, et dans les jeux de données UAV-LiDAR, MIoU a augmenté jusqu'à 57,68%, dans les jeux de données UAV-LiDAR avec caractéristique spectrale incluse, la MIoU moyenne, obtenue par l’algorithme SSAFormer, a été améliorée de 1,48%; (3) par rapport aux données multispectrales UAV-LiDAR, l'intersection moyenne sur union moyenne a augmenté de 5,35%, la précision globale OA a augmenté de 1,81%, la précision de classification (F1-score) dans les jeux de données UAV-LiDAR avec caractéristique spectrale incluse a été améliorée de 2,6%; (4) l’algorithme SSAFormer proposé dans cette étude permet d’atteindre la meilleure précision de classification (F1-score) pour les arbres de mangrove de 97,07%, pour les arbres de Tonghua jusqu'à 91,99%, pour la croissance des herbes marines de 93,64%, les scores F1 moyens pour les arbres Tonghua ont nettement augmenté dans le modèle SSAFormer et atteignent un maximum de 86,91%. L’algorithme SSAFormer proposé dans cette étude permet d’améliorer considérablement la précision de la classification des communautés de mangroves.
关键词
remote sensing;mangrove;GF-7 multispectral;UAV-LiDAR point clouds;SSAFormer;deep learning;Active and passive image combination;feature selection;Fine classification of community