Структура сети интеграции трех ветвей для семантического сегментирования высокоразрешенных изображений дистанционного зондирования

SHAN Huilin ,  

WANG Xingtao ,  

LIU Wenxing ,  

MENG Xiangyuan ,  

WANG Zhihao ,  

ZHANG Yinsheng ,  

摘要

Глубокое семантическое сегментирование играет важную роль в понимании сцен высокого разрешения с помощью дистанционного зондирования. В изображениях дистанционного зондирования существует большое разнообразие по количеству и масштабу объектов различных категорий, а также сложные пространственные и семантические особенности. Прямое объединение пространственных и семантических признаков имеет недостаток в недостаточном извлечении богатых признаков в изображении. В этой статье предлагается алгоритм семантического сегментирования высокого разрешения изображений дистанционного зондирования на основе интеграции трех ветвей сети, который решает проблемы недостаточного извлечения признаков и недостаточного использования признаков. Во-первых, для пространственных и семантических признаков разработаны отдельные ветви извлечения признаков с целью полного использования пространственной и семантической информации изображений дистанционного зондирования, что усилило взаимодополняемость признаков. Во-вторых, предложена концепция ветви согласованности, направленная на изучение семантической и пространственной согласованности признаков для улучшения производительности сети в сегментации. Наконец, предложен модуль многоуровневого слияния признаков для взвешенного слияния трех ветвей признаков, повышающий адаптивные способности модели. Кроме того, в данной статье предложен метод увеличения данных случайного образца с пространственной согласованностью, а также введена смешанная функция потерь, решающая проблему дисбаланса количества категорий в наборе данных, эффективно смягчая проблему переобучения из-за слишком малого числа образцов классов в наборе данных. Результаты экспериментов показывают, что предложенный алгоритм в сегментации изображений дистанционного зондирования на наборах данных Потсдама и Вайхингена в среднем достигает 87,84% и 87,49% соответственно, что подтверждает, что данный алгоритм способен эффективно извлекать и объединять семантические и пространственные признаки высокого разрешения изображений дистанционного зондирования, повышать точность сегментации изображений дистанционного зондирования.

关键词

высокоразрешенные изображения дистанционного зондирования; семантическое сегментирование; многоуровневое слияние; увеличение данных; извлечение признаков нескольких ветвей; пространственная согласованность

阅读全文