A maior disponibilidade de imagens de sensoriamento remoto de alta resolução tornou a detecção refinada de objetos em imagens de sensoriamento remoto uma direção de pesquisa importante nos campos de sensoriamento remoto e visão computacional. Para enfrentar os problemas de utilização insuficiente de dados similares, impacto de rótulos incorretos na precisão do modelo e dificuldade em distinguir categorias semelhantes na detecção refinada de objetos em imagens de sensoriamento remoto, este artigo propõe um método de detecção refinada de objetos em imagens de sensoriamento remoto baseado em uma cabeça de classificação dupla. Primeiro, para resolver o problema da incapacidade de utilizar efetivamente dados similares na detecção refinada de objetos em imagens de sensoriamento remoto, propõe-se uma cabeça de detecção de dupla classificação, onde diferentes cabeças de classificação são treinadas em conjuntos diferentes de dados, permitindo que dados similares com definições de classe diferentes participem conjuntamente do treinamento, aproveitando efetivamente os dados similares e melhorando significativamente a precisão do modelo. Em segundo lugar, para lidar com o problema do ruído nos rótulos de treinamento, foi projetado um método de filtragem de etiquetas incorretas baseado em predição para reduzir o impacto de etiquetas incorretas no treinamento do modelo. Finalmente, para enfrentar o problema de grandes diferenças intra-classe e pequenas diferenças inter-classe na detecção refinada de objetos, foi definida uma perda de entropia cruzada com margem, que melhora a precisão do modelo ao aumentar a margem da classificação. Experimentos nos conjuntos de dados da competição de detecção refinada de alvos em sensoriamento remoto e FAIR1M mostraram que o método proposto melhora significativamente a precisão e a robustez da detecção refinada de objetos em imagens de sensoriamento remoto. O código está disponível em código aberto em https://github.com/zf020114/DCH.
关键词
sensoriamento remoto;aprendizado profundo;detecção refinada de objetos;detecção direcionada de objetos;cabeça de classificação dupla;filtragem de etiquetas incorretas;perda de entropia cruzada com margem