Methode zur feinkörnigen Objekterkennung in Fernerkundungsbildern auf Basis eines doppelten Klassifikationskopfs

ZHANG Feng ,  

TENG Shuhua ,  

HAN Xing ,  

WANG Yingqian ,  

WANG Xueying ,  

摘要

Die deutlich gestiegene Verfügbarkeit hochauflösender Fernerkundungsbilder hat die feinkörnige Objekterkennung in Fernerkundungsbildern zu einem wichtigen Forschungsbereich in der Fernerkundung und Computer Vision gemacht. Zur Bewältigung der Probleme der unzureichenden Nutzung ähnlicher Daten, der Beeinflussung der Modellgenauigkeit durch fehlerhafte Labels und der Schwierigkeit, ähnliche Klassen zu unterscheiden, schlägt diese Arbeit eine Methode zur feinkörnigen Objekterkennung in Fernerkundungsbildern auf Basis eines doppelten Klassifikationskopfs vor. Zunächst wird für das Problem der ineffektiven Nutzung ähnlicher Daten im feinkörnigen Objekterkennungsprozess ein doppelter Klassifikationskopf vorgeschlagen, bei dem unterschiedliche Klassifikationsköpfe auf verschiedenen Datensätzen trainiert werden, sodass ähnlich definierte Daten gemeinschaftlich trainiert werden können, wodurch die Nutzung ähnlicher Daten effektiv verbessert und die Modellgenauigkeit deutlich gesteigert wird. Zweitens wird für das Problem des Rauschens in Trainingslabels eine methodenbasierte Filterung fehlerhafter Labels entwickelt, die den Einfluss fehlerhafter Labels auf das Modelltraining verringert. Schließlich wird für das Problem großer intraklassiger Unterschiede und kleiner interklassiger Unterschiede in der feinkörnigen Objekterkennung ein Margin-Cross-Entropy-Verlust definiert, der durch Vergrößerung der Klassifikationsgrenzen die Modellgenauigkeit verbessert. Experimente auf Datensätzen des feinkörnigen Fernerkundungszielerkennungswettbewerbs und FAIR1M zeigen, dass die vorgeschlagene Methode die Genauigkeit und Robustheit der feinkörnigen Objekterkennung in Fernerkundungsbildern deutlich verbessert. Der Code ist Open Source auf https://github.com/zf020114/DCH.

关键词

Fernerkundung;Deep Learning;feinkörnige Objekterkennung;gerichtete Objekterkennung;doppelter Klassifikationskopf;Filterung fehlerhafter Labels;Margin-Cross-Entropy-Verlust

阅读全文