Ante el desequilibrio del rendimiento integral de los algoritmos de detección de aprendizaje profundo en tareas de procesamiento en tiempo real de imágenes de teledetección y la dificultad de implementación en dispositivos embebidos espaciales, basado en el algoritmo YOLOX-s, se propone un algoritmo rápido de detección de objetivos de aeronaves ópticas de teledetección LAD-YOLOX (Lightweight Aircraft Detection YOLOX) para una plataforma embebida orientada. Primero, en el diseño de la red de percepción de hardware, basado en ShuffleNetv2, diseñar bloques ES-Block (Enhanced ShuffleNet Block) ultraligeros y de alta precisión, reconstruir la red de extracción de características principales original; segundo, introducir GSConv para construir la red de fusión de características de cuello ligero GS-Neck, equilibrar la relación de cantidad de parámetros entre la parte delantera y trasera de la estructura, reducir la complejidad de cálculo a la vez que se disminuye la pérdida de precisión; luego, diseñar una estructura de red ligeramente desacoplada para mejorar aún más la codificación de las características de clasificación y localización de los objetivos de aeronaves, reducir la cantidad de parámetros del modelo, mejorar el rendimiento de detección; finalmente, sustituir la función de pérdida de predicción de confianza Varifocal Loss y la función de pérdida de localización de la caja SIoU Loss en el algoritmo LAD-YOLOX, para mejorar la velocidad de convergencia del entrenamiento del modelo y la precisión de la inferencia. Basándose en el conjunto de datos RSOD público de teledetección y en el conjunto de datos de aeronaves de fabricación propia, se realizaron pruebas de simulación comparativa con otros modelos SOTA para el algoritmo LAD-YOLOX propuesto en este artículo. Los resultados muestran que: en el conjunto de datos RSOD de teledetección, la complejidad del cálculo del algoritmo LAD-YOLOX se comprime al 43,72% del modelo YOLOX-s original, la pérdida de precisión de detección es del 0,2%, la velocidad de detección se incrementa a 24 imágenes por segundo; el método propuesto en este artículo permite completar la implementación y aceleración del algoritmo en la placa de evaluación XILINX EK-U1-ZCU102-G, con una velocidad de detección del conjunto de datos de aeronaves de fabricación propia de al menos 26,53 imágenes por segundo, para satisfacer la necesidad de detección precisa en tiempo real.
关键词
Teledetección; Detección de objetivos en órbita; Ligereza; YOLOX; Conjunto de datos RSOD; ZCU102