Die tiefgehende semantische Segmentierung ist entscheidend für das Verständnis hochauflösender Fernerkundungsszenen. Fernerkundungsbilder weisen große Unterschiede in der Anzahl und Größe der verschiedenen Objektklassen auf, besitzen komplexe räumliche und semantische Merkmale, und die direkte Stapelung der räumlichen und semantischen Merkmale hat den Nachteil, dass die reichhaltigen in den Bildern enthaltenen Merkmale nicht vollständig genutzt werden. Daher wird in diesem Artikel ein Algorithmus zur semantischen Segmentierung hochauflösender Fernerkundungsbilder auf Basis eines dreigeteilten Ensemble-Netzwerkes vorgeschlagen, um Probleme wie unzureichende zielgerichtete Merkmalsextraktion und ungenügende Merkmalsnutzung zu lösen. Zunächst wurden für räumliche und semantische Merkmale unterschiedliche Extraktionszweige entworfen, um die räumlichen und semantischen Informationen von Fernerkundungsbildern vollständig zu nutzen und die Komplementarität der Merkmale zu verbessern; zweitens wird das Konzept eines Konsistenzzweiges vorgeschlagen, dessen Ziel es ist, Merkmale der semantischen und räumlichen Konsistenz zu erlernen und somit die Segmentierungsleistung des Netzwerks zu verbessern; schließlich wird ein multiskaliges Merkmalsfusionsmodul vorgeschlagen, das die Merkmale der drei Zweige gewichtet fusioniert und die Anpassungsfähigkeit des Modells erhöht. Darüber hinaus schlägt dieser Artikel eine Datenaugmentierungsmethode mit zufälligem Sampling und Zuschneiden vor, die den Raumkonsistenzfokus berücksichtigt, und fügt eine Mischungsverlustfunktion hinzu, um das Problem des Klassenungleichgewichts im Datensatz zu lösen und die Überanpassung durch zu geringe Klassensamples effektiv zu mildern. Experimentelle Ergebnisse zeigen, dass der vorgeschlagene Algorithmus im Durchschnitt einen Intersection-over-Union-Wert von 87,84 % bzw. 87,49 % für die ISPRS-Potsdam- und Vaihingen-Datensätze erreicht, was beweist, dass dieser Algorithmus semantische und räumliche Merkmale hochauflösender Fernerkundungsbilder effizient extrahieren und fusionieren kann, um die Segmentierungsgenauigkeit von Fernerkundungsbildern zu verbessern.