La detección de objetos dirigidos con imágenes de teledetección es una tarea desafiante en el campo de la visión por computadora, ya que los métodos tradicionales de marco horizontal no pueden localizar con precisión objetos dirigidos con escala diversa, orientación arbitraria y disposición densa. La representación de marco dirigida de cinco parámetros ampliamente utilizada en la actualidad, debido a la periodicidad del ángulo de dirección y el problema del intercambio de bordes, aumenta la complejidad del entrenamiento del modelo. Para resolver los problemas mencionados anteriormente, en este artículo se presenta un modelo de detección de objetos dirigidos basado en la ecuación elíptica EllipticNet (Red de Detección de Objetos Orientados Basada en la Ecuación Elíptica). En primer lugar, EllipticNet descompone el problema de predicción del ángulo en dos subproblemas: regresión cuantitativa del ángulo y clasificación de la dirección de rotación, superando así el problema de la discontinuidad de los bordes del marco dirigido de cinco parámetros. Además, en este artículo se propone una función de pérdida restringida a la elipse, que mejora las relaciones geométricas internas entre los parámetros de la elipse y aumenta la robustez del entrenamiento de EllipticNet. Además, este artículo presenta un módulo de pirámide de convoluciones espaciales con huecos en capas, que mejora significativamente la capacidad de EllipticNet para representar características de múltiples escalas. Por último, las experimentaciones comparativas en conjuntos de datos de teledetección conocidos, como DOTA, HRSC2016 y UCAS_AOD, muestran que el enfoque presentado en este artículo es competitivo en términos de rendimiento y eficiencia, lo que demuestra el valor práctico de este enfoque en la detección de objetos dirigidos con imágenes de teledetección.
关键词
Detección de objetos dirigidos, ecuación elíptica, mejora de características, imágenes de teledetección de alta resolución