Точное извлечение типичных целей на SAR-изображениях на основе совместного частотного и пространственного анализа

YANG Han ,  

SUN Minhong ,  

WANG Xinyi ,  

LIU Jin ,  

ZENG Deguo ,  

DING Chenwei ,  

WEI Shiqing ,  

摘要

Изображения синтезированной апертурной радиолокационной системы (SAR, Synthetic Aperture Radar) содержат присущий когерентный шум, затрудняющий точное улавливание взаимосвязей между сложными объектами, что делает задачи извлечения целей из SAR-изображений крайне сложными. Существующие методы глубокого обучения для извлечения целей испытывают недостаток точности под воздействием когерентного шума и сложных объектов. В связи с этим в настоящем исследовании предложена трансформерная сеть S3T-Net (Spectral-spatial synergetic transformer network), основанная на совместном использовании частотной и пространственной областей, для точного извлечения типичных целей на SAR-изображениях. Сеть объединяет частотный кодировочный модуль и визуальный трансформер (ViT) для извлечения и объединения признаков SAR-изображений. Частотный модуль использует дискретное вейвлет-преобразование (DWT) для понижающей выборки и спектрально-иерархическое двухдоменное внимание SHDA (Spectral-hierarchical dual-domain attention) для захвата локальных текстурных деталей и снижения чувствительности к шуму в частотной области, в то время как ViT-модуль благодаря глобальному механизму самовнимания понимает общую структуру изображения и дальние зависимости. Кроме того, в исследовании применяется синергетическое взвешенное объединение признаков SWFC (Synergistic weighted feature confluence) для интеграции информации из двух кодирующих модулей и разработан рекурсивный модуль уточнения частотно-пространственной области RFSR (Recursive frequency-space refinement), который уменьшает шум при повышающей выборке и оптимизирует границы целей. Эксперименты на трех открытых наборах данных SAR для задач SARBuD (здания), HRSID (судна) и FRBS (разливы нефти) показали, что предложенный метод превосходит несколько современных моделей с лучшими результатами (SoTA) по метрике Dice, опережая их на 0.52%, 0.62% и 1.04% соответственно на этих наборах данных. В целом, метод совместного использования частотной и пространственной областей эффективно усиливает способность захвата информации о объектах в условиях высокого шума, предлагая новые технические пути и теоретическую поддержку задачам извлечения целей на SAR-изображениях.

关键词

SAR-изображения; извлечение целей; глубокое обучение, подавление шума; совместный частотный и пространственный анализ; Transformer

阅读全文