Die Geokodierung von Bildern mit Cross-View zielt darauf ab, die ähnlichsten Bilder in einer Referenzgalerie anhand der Entsprechung zwischen Bildern aus verschiedenen Blickwinkeln zu finden und dann ihre geografischen GPS-Koordinaten zu verwenden, um die Geokodierungsfunktion zu realisieren. Die traditionelle Geokodierung von Bildern mit einem einzigen Blickwinkel ist aufgrund der Qualität, des Maßstabs und der Genauigkeit der Geokodierung eingeschränkt, weshalb in den letzten Jahren viele Forscher und Organisationen eine Reihe von Datensätzen für die Geokodierung von Bildern mit Cross-View veröffentlicht haben, um die Grundlage für die Verbesserung der Genauigkeit der Geokodierung zu schaffen. Derzeit fehlt jedoch eine systematische Analyse der Datensätze für die Geokodierung von Bildern mit Cross-View. In diesem Artikel haben wir zunächst 32 klassische Datensätze für die Geokodierung von Bildern mit Cross-View seit ihrer Entwicklung überprüft und ein Klassifikationssystem in vier Dimensionen - Sichtinformationen, Konstruktionstyp, Realitätsgrad, Zeitinformationen aufgebaut und die Grundinformationen zu den Datensätzen zusammengefasst; dann haben wir eine eingehende Analyse der Datensätze für die Geokodierung von Bildern mit Cross-View durch Beschreibung, Einfluss, Schlüsselwörter, Beschaffungsquelle und Anwendungsbereich durchgeführt und die wichtigsten aktuellen Algorithmen für die Geokodierung von Bildern mit Cross-View zusammengefasst; schließlich haben wir anhand der Analyse von Multi-Modal-Trends bei Datensätzen, großen Modellierungsmethoden, Bewegtbildverarbeitung und Modelloptimierung die zukünftigen Entwicklungsrichtungen von Datensätzen für die Geokodierung von Bildern mit Cross-View erörtert, die für Forscher auf den entsprechenden Gebieten nützlich sein können.
关键词
Cross-View; Bilder-Geokodierung; Datensatz; Deep Learning; Drohnen; Bildsuche; Bildabgleich; Computer Vision