Remote sensing target detection by fusing improved retinex image enhancement and adaptive label assignment

HUANG Hu ,  

ZHENG Hunan ,  

TANG Fei ,  

LI Chenyi ,  

摘要

Цели в дистанционных изображениях имеют большое изменение масштаба, плотное распределение целей, легко путать похожие материалы, многосложное влияние сложной фона и недостаток деталей изображения. Существующие алгоритмы обнаружения вращающихся целей обычно имеют высокую вычислительную нагрузку и до сих пор есть пространство для повышения точности. Данные исследования улучшают текущий ведущий детектор YOLOv9 и разрабатывают эффективный и точный детектор вращающихся целей на дистанционных изображениях RSO-YOLO (YOLO для изображений дистанционного зондирования с ориентированным ограничивающим боксом). Во-первых, используется модуль увеличения данных с низкой освещенностью для улучшения проблем, таких как слабое освещение, шум, размытие и недостаток контрастности. Во-вторых, разработан отдельный угловой прогностический модуль, чтобы алгоритм имел восприятие направления целей на дистанционных изображениях. В-третьих, в модель вводится потеря пересечения над Калманом KFIoU (Kalman Filter Intersection over Union), чтобы решить проблему периодичности угла, возникающую из-за представления вращающихся целей. Используется потеря фокуса распределения DFL (Distribution Focal Loss) для изучения распределения вращающихся ограничивающих рамок и уменьшения проблемы неточности углов для целей в виде близких квадратных целей в методе гауссовского моделирования. В-четвертых, создается динамическая стратегия распределения меток для обнаружения вращающихся целей, при распределении которых учитываются пересекающиеся сигналы (IOU) и показатели категорий (Оценки), чтобы создать лучшее отражение характеристик целей. Наконец, используется вероятность пересечения ProbIoU на основе расстояния Хеллингера для уменьшения проблемы негармоничного ингибирования нестрогого. Предложенный в этом исследовании детектор вращающихся целей RSO-YOLO проверяется на открытом наборе данных DIOR-R и сравнивается с несколькими типичными методами детекции вращающихся целей, результаты показывают, что всесторонние показатели предложенного метода RSO-YOLO в этом исследовании достигают 81,1% средней точности mAP (mean Average Precision), занимая первое место и способен обеспечить реальное время обнаружения. Кроме того, с использованием модуля увеличения данных сопровождения может быть увеличен на 1,5%. Следовательно, предложенный в этом исследовании метод RSO-YOLO можем одновременно уделять внимание скорости и точности обнаружения вращающихся целей, он имеет инженерную ценность и практический потенциал в морском и аэропортовском контроле, управлении городами, оценке бедствий, агрономическом и лесоводческом обследовании, и предоставляет повторно используемое модульное решение для последующих исследований обнаружения вращения в условиях низкого освещения и сложного фона.

关键词

deep learning;remote sensing object detection;rotated bounding boxes;data augmentation;rotated task alignment learning;two-dimensional gaussian distribution

阅读全文