Waldklassifikation basierend auf Cross-Attention-Fusion von multispektralen und SAR-Daten

XIE Yifan ,  

JIA Zihan ,  

ZHANG Xiaoli ,  

摘要

Die Fernerkundungstechnologie hat sich aufgrund ihrer großflächigen Abdeckung, hohen Aktualität und Fähigkeit zur multidimensionalen Informationsgewinnung zu einem wichtigen Werkzeug in der Forstwirtschaftsforschung entwickelt. Multispektrale Fernerkundungsbilder weisen eine hohe räumliche und spektrale Auflösung auf und können effektiv spektrale Unterschiede zwischen verschiedenen Landbedeckungen erfassen, während Synthetic Aperture Radar (SAR)-Daten stabile Informationen über Oberflächenstrukturen und Texturmerkmale liefern, die eine wichtige Ergänzung zu spektralen Merkmalen darstellen. Allerdings führen Unterschiede in der Modalstruktur und Informationsdarstellung zwischen aktiven und passiven Fernerkundungsdaten häufig zu begrenzten Fusionswirkungen, was die Klassifikationsgenauigkeit beeinträchtigt. Um diesem Problem zu begegnen, wurde in dieser Studie ein Teilbereich der Stadt Pu’er in der Provinz Yunnan als Untersuchungsgebiet gewählt, wobei drei Waldbaumarten (Gruppen) (Pinus kesiya, Eukalyptus, Eiche) sowie ein wirtschaftlicher Waldtyp (Teegarten) und weitere drei Landbedeckungsarten als Klassifikationsobjekte ausgewählt wurden. Es wurde ein Tiefenlernnetzwerk für die Waldklassifikation unter Berücksichtigung kleiner Stichprobenbedingungen entwickelt, das aktive und passive Fernerkundungsdaten fusioniert. Die Methode fusioniert Sentinel-2-Multispektralbilder und Sentinel-1-SAR-Daten, schlägt ein von multispektralen Bildern dominiertes Cross-Attention-Fusionsnetzwerk vor und führt einen regulierenden Gate-Mechanismus mit lernbaren Dropout-Raten ein, um eine dynamische Fusion von Self-Attention- und Cross-Attention-Merkmalen zu ermöglichen. Im Fusionsprozess extrahiert das Modell mit Hilfe des Self-Attention-Mechanismus ausgeprägte Merkmale der multispektralen Bilder und kombiniert diese mit Cross-Attention, um die Reaktion auf wichtige SAR-Bereiche zu steuern, und kontrolliert dynamisch den Beitrag der einzelnen Modalitäten in der Merkmalsfusion. Die experimentellen Ergebnisse zeigen, dass die vorgeschlagene Methode unter mehreren Fusionsstrategien und -ebenen die beste Leistung erzielt, mit einer Gesamtklassifikationsgenauigkeit von 95,24 %, während die Klassifikationsgenauigkeit für Eukalyptus, Teegarten, Eiche und Pinus kesiya jeweils 96,78 %, 94,07 %, 91,73 % bzw. 92,90 % beträgt. Die Studie bestätigt die Wirksamkeit des Cross-Attention-Mechanismus in der kooperativen Modellierung aktiver und passiver Fernerkundungsinformationen und bietet einen praktikablen Ansatz und technische Unterstützung für die multisource Fernerkundungswaldklassifikation in komplexen Umgebungen.

关键词

Sentinel-2;Sentinel-1;Cross-Attention;Merkmalsfusion;Waldklassifikation;Prototypnetzwerk;Concrete Dropout

阅读全文