La geolocalización de imágenes de ángulo cruzado tiene como objetivo recuperar las imágenes más similares de la biblioteca de imágenes de referencia mediante la coincidencia de imágenes desde ángulos de vista diferentes, y luego utilizar sus etiquetas GPS para realizar la función de geolocalización. La geolocalización tradicional de imágenes de un solo ángulo de vista está limitada por la calidad de los conjuntos de datos, su escala y la precisión de la geolocalización, por lo que en los últimos años muchos investigadores y organizaciones han publicado series de conjuntos de datos geográficos de imágenes de ángulo cruzado para establecer una base de datos y mejorar la precisión de la geolocalización. Sin embargo, actualmente falta un análisis sistemático de los conjuntos de datos de geolocalización de imágenes de ángulo cruzado. En este artículo, primero sistematizamos 32 conjuntos de datos geográficos clásicos de ángulo cruzado desde el inicio del desarrollo de la geolocalización de imágenes de ángulo cruzado, construyendo un sistema de clasificación de cuatro dimensiones: información del ángulo de vista, tipos de construcción, realidad e información temporal; luego, realizamos un análisis en profundidad de los conjuntos de datos de geolocalización de imágenes de ángulo cruzado a través de metadatos, influencia, palabras clave, fuentes de adquisición y áreas de aplicación ; y recopilamos un resumen de los principales algoritmos actuales de geolocalización de imágenes de ángulo cruzado ; finalmente, discutimos las futuras orientaciones para el desarrollo de los conjuntos de datos de geolocalización de imágenes de ángulo cruzado a través de las tendencias multimodales, los métodos de modelos grandes, el procesamiento de interferencias en imágenes y la optimización de los modelos en cuatro aspectos, que pueden servir como referencia para los investigadores relacionados.
关键词
ángulo cruzado; geolocalización de imágenes; conjuntos de datos; aprendizaje profundo; drones; recuperación de imágenes; coincidencia de imágenes; visión por ordenador