La mayor disponibilidad de imágenes de teledetección de alta resolución ha convertido a la detección fina de objetivos en imágenes de teledetección en una importante línea de investigación en los campos de la teledetección y la visión por computador. Para abordar los problemas de la insuficiente utilización de datos similares, la influencia de etiquetas erróneas en la precisión del modelo y la dificultad para distinguir categorías similares en la detección fina de objetivos en imágenes de teledetección, este artículo propone un método de detección fina basado en una doble cabeza de clasificación. En primer lugar, para resolver el problema del uso ineficaz de datos similares, se propone una cabeza de detección con doble clasificación, donde diferentes cabezas se entrenan con distintos conjuntos de datos, permitiendo que los datos similares con diferentes definiciones de categorías participen conjuntamente en el entrenamiento, lo que mejora significativamente la precisión del modelo. En segundo lugar, para abordar el problema del ruido en las etiquetas de entrenamiento, se diseñó un método de filtrado de etiquetas erróneas basado en predicciones para reducir el impacto de las etiquetas erróneas en el entrenamiento del modelo. Finalmente, para el problema de la gran variabilidad intra-clase y la pequeña variabilidad inter-clase en la detección fina de objetivos, se definió una pérdida de entropía cruzada con margen que mejora la precisión del modelo ampliando los límites de clasificación. Los experimentos en el conjunto de datos del concurso de detección fina de objetivos de teledetección y en FAIR1M muestran que el método propuesto mejora significativamente la precisión y robustez de la detección fina de objetivos en imágenes de teledetección. El código está disponible de forma abierta en https://github.com/zf020114/DCH.
关键词
teledetección;aprendizaje profundo;detección fina de objetivos;detección dirigida de objetivos;doble cabeza de clasificación;filtrado de etiquetas erróneas;pérdida de entropía cruzada con margen