Visão geral dos conjuntos de dados de geo-localização de imagens cruzadas

ZHANG Xiao ,  

GAO Yi ,  

XIA Yuxiang ,  

ZHAO Chunxue ,  

摘要

A geo-localização de imagens cruzadas (Cross-view Image Geo-localization) tem como objetivo recuperar as imagens de referência mais semelhantes na biblioteca de referência, com base na correspondência entre imagens de diferentes pontos de vista, e posteriormente utilizar as suas etiquetas GPS para realizar a localização. A localização geográfica de imagens de um único ponto de vista tradicional é limitada por fatores como a qualidade, a escala e a precisão do conjunto de dados, por isso, nos últimos anos, diversos investigadores e instituições publicaram uma série de conjuntos de dados de geo-localização de imagens cruzadas, criando as bases de dados para aumentar a precisão da geo-localização. No entanto, atualmente, ainda falta uma análise sistemática dos conjuntos de dados de geo-localização de imagens cruzadas. Neste artigo, foi feita uma triagem de 32 conjuntos de dados clássicos de geo-localização de imagens cruzadas, desde o desenvolvimento até à categoria construída, realidade, informação temporal e, a partir de 4 dimensões, uma produção de uma classificação para resumir as informações básicas dos conjuntos de dados. Em seguida, analisou-se profundamente os conjuntos de dados de geo-localização de imagens cruzadas, resumindo e organizando os principais algoritmos de geo-localização de imagens cruzadas, metadados, influência, palavras-chave, origem de aquisição e áreas de aplicação. Por fim, foram exploradas as tendências multi-modais, os métodos de grandes modelos, o processamento de interferências de imagens e a otimização de modelos de conjuntos de dados de geo-localização cruzada, e podem fornecer orientações para os pesquisadores em áreas relacionadas.

关键词

Cross-view; Geo-localização de imagens; Conjunto de dados; Aprendizado profundo; Drone; Recuperação de imagem; Correspondência de imagem; Visão computacional

阅读全文