Structure du réseau d'intégration à trois branches pour la segmentation sémantique des images de télédétection à haute résolution

SHAN Huilin ,  

WANG Xingtao ,  

LIU Wenxing ,  

MENG Xiangyuan ,  

WANG Zhihao ,  

ZHANG Yinsheng ,  

摘要

La segmentation sémantique en profondeur joue un rôle crucial dans la compréhension des scènes à haute résolution par télédétection. Les images de télédétection présentent une grande diversité en termes de nombre et d'échelle des objets des différentes catégories, ainsi que des caractéristiques spatiales et sémantiques complexes. La méthode de fusion directe des caractéristiques spatiales et sémantiques présente un inconvénient en termes d'extraction insuffisante des riches caractéristiques présentes dans l'image. Par conséquent, cet article propose un algorithme de segmentation sémantique d'images à haute résolution par télédétection basé sur un réseau d'intégration à trois branches, qui résout les problèmes d'extraction insuffisante des caractéristiques et d'utilisation insuffisante des caractéristiques. Tout d'abord, des branches d'extraction de caractéristiques distinctes sont conçues pour les caractéristiques spatiales et sémantiques, afin de tirer pleinement parti des informations spatiales et sémantiques des images de télédétection, renforçant ainsi la complémentarité des caractéristiques. Ensuite, une branche de cohérence est proposée, visant à apprendre les caractéristiques de cohérence sémantique et spatiale pour améliorer les performances du réseau dans la segmentation. Enfin, un module de fusion de caractéristiques multi-échelles est proposé pour fusionner pondérément les caractéristiques des trois branches, améliorant ainsi les capacités adaptatives du modèle. De plus, cet article propose une méthode d'augmentation de données d'échantillonnage aléatoire axée sur la cohérence spatiale, ainsi qu'une fonction de perte mixte, résolvant le problème du déséquilibre dans le nombre de catégories dans l'ensemble de données, atténuant efficacement le surapprentissage dû à un nombre insuffisant d'échantillons de classe dans l'ensemble de données. Les résultats des expériences montrent que l'algorithme proposé dans la segmentation d'images de télédétection sur les ensembles de données de Potsdam et de Vaihingen atteint en moyenne 87,84 % et 87,49 % respectivement, prouvant que cet algorithme est capable d'extraire et de fusionner efficacement les caractéristiques sémantiques et spatiales des images de télédétection haute résolution, améliorant la précision de la segmentation des images de télédétection.

关键词

images de télédétection haute résolution ; segmentation sémantique ; fusion multi-échelle ; augmentation des données ; extraction de caractéristiques multi-branches ; cohérence spatiale

阅读全文