LAFI-Diffusion: método de construção e geração de conjunto de dados de detecção de alvos de navios em sensoriamento remoto por satélite baseado em modelo de difusão controlável
A detecção e o reconhecimento de alvos de navios em imagens de sensoriamento remoto por satélite têm um valor de aplicação importante nas áreas de monitoramento marítimo, gestão de navegação e reconhecimento militar. No entanto, os conjuntos de dados existentes apresentam limitações em escala, diversidade e granularidade fina, o que restringe severamente o desenvolvimento desta área. Para romper esse gargalo, este artigo construiu um conjunto de dados de detecção de instâncias de navios em grande escala e granularidade fina chamado LAFI (LArge-scale FIne-grained Ship Instance Detection) e, baseado em um modelo de difusão estável, foi construído adicionalmente um conjunto de dados de detecção de alvos de navios na casa dos milhões chamado LAFI-Diffusion. Este estudo apresenta as seguintes contribuições inovadoras: (1) LAFI é atualmente o maior conjunto de dados públicos de navios em escala e com maior diversidade de categorias, contendo 8000 imagens de sensoriamento remoto de alta resolução, 49 tipos de navios e 48717 instâncias anotadas com precisão; (2) utilizando um modelo de difusão controlável, milhões de imagens sintéticas são geradas sob a orientação de prompts textuais navio-oceano, em diferentes condições marítimas, climáticas e temporais, apoiando o pré-treinamento de modelos de detecção de alvos, melhorando significativamente a capacidade de generalização dos modelos em cenários marítimos complexos, enquanto reduz a interferência ambiental. Finalmente, com base no conjunto de dados LAFI, este artigo avaliou sistematicamente sete algoritmos principais de detecção de caixas orientadas, fornecendo uma referência importante para pesquisas futuras.
关键词
imagens de sensoriamento remoto; detecção de alvos de navios; conjunto de dados; modelo de difusão; geração de dados sintéticos; reconhecimento de granularidade fina; caixas delimitadoras orientadas; aumento de dados