Les images Radar à Synthèse d’Ouverture (SAR - Synthetic Aperture Radar) présentent un bruit de speckle cohérent inhérent, ce qui rend difficile la capture précise des relations entre des objets complexes, rendant ainsi la tâche d’extraction des cibles dans les images SAR particulièrement difficile. Les méthodes actuelles d’extraction de cibles par apprentissage profond rencontrent des problèmes de précision en raison du bruit de speckle et de la complexité des objets. À cet égard, cette étude propose un réseau Transformer synergique spectro-spatial appelé S3T-Net (Spectral-spatial synergetic transformer network) pour une extraction fine des cibles typiques dans les images SAR. Ce réseau combine une unité d’encodage fréquentiel et une unité d’encodage Transformer visuel (ViT) pour extraire et fusionner les caractéristiques des images SAR. L’unité d’encodage fréquentiel utilise la transformée en ondelettes discrète (DWT) pour la sous-échantillonnage, et l’attention duale spectro-hiérarchique SHDA (Spectral-hierarchical dual-domain attention) pour capturer les détails locaux du texture dans le domaine fréquentiel tout en réduisant la sensibilité au bruit, tandis que l’unité ViT, grâce à son mécanisme d’attention globale, comprend la structure globale de l’image et les dépendances à longue portée. De plus, cette étude emploie la fusion synergetique pondérée SWFC (Synergistic weighted feature confluence) pour intégrer les informations des deux unités d’encodage, et conçoit un module récursif de raffinage fréquentiel-spatial RFSR (Recursive frequency-space refinement) qui réduit les interférences de bruit lors de la sur-échantillonnage et optimise les frontières des cibles. Les résultats expérimentaux sur trois ensembles de données publics SAR pour les tâches SARBuD (bâtiments), HRSID (navires) et FRBS (fuites de pétrole) montrent que la méthode proposée surpasse plusieurs modèles d’état de l’art (SoTA) selon l’indice Dice, avec des gains respectifs de 0,52 %, 0,62 % et 1,04 % sur ces ensembles. En somme, la méthode synergique spectro-spatiale renforce efficacement la capacité de capture des informations des objets dans un environnement à forte interférence, offrant ainsi une nouvelle voie technique et un soutien théorique pour la tâche d’extraction des cibles des images SAR.
关键词
images SAR; extraction de cibles; apprentissage profond, suppression du bruit; synergie fréquentielle-spatiale; Transformer