Fernerkundungsbilder weisen signifikante Unterschiede in der Zielgröße und komplex wechselnde Hintergründe auf, mit Phänomenen wie spektraler Vermischung von Objekten und unscharfen Merkmalgrenzen, was die Schwierigkeit der semantischen Segmentierungsaufgabe erhöht. Zur Bewältigung des Problems der Schwierigkeiten bei der semantischen Segmentierung von Zielen in Fernerkundungsbildern unter unterschiedlichen Lichtbedingungen aufgrund der gegenseitigen Abhängigkeit von Merkmalen wird in diesem Artikel ein auf Entwirrung basierendes semantisches Segmentierungsmodell für Fernerkundungsbilder vorgeschlagen, das aus einem Beleuchtungs-Reflexions-Entwirrungsnetzwerk (LRD-Net) und einem multimodalen semantischen Segmentierungsnetzwerk (MSS-Net) besteht. Zunächst wird das LRD-Net auf Basis der Retinex-Theorie entwickelt, um Beleuchtungs- und Reflexionseigenschaften in optischen Bildern zu zerlegen, wobei ein gewichtsteilender Transformer (WS-Transformer) zur Extraktion globaler und lokaler Zieleigenschaften verwendet wird; zweitens wird ein mehrskaliges Rauschmodul eingeführt, um die Beleuchtungskomponente adaptiv zu verstärken und die Entwirrungsfähigkeit des Modells zu verbessern, wobei durch ein Modul zur Hervorhebung signifikanter Merkmale (SE) die Unterschiede zwischen den Komponentenmerkmalen betont werden; schließlich wird ein Kanteneigenschaftsextraktionsmodul (EE) verwendet, um die Kantenerkennung von Fernerkundungszielen zu verbessern, und durch das multimodale semantische Segmentierungsnetzwerk (MSS-Net) werden Beleuchtungs- und Reflexionseigenschaften fusioniert, um die semantische Segmentierungsleistung zu verbessern. Auf den allgemeinen Datensätzen ISPRS Vaihingen und ISPRS Potsdam erreichen die Bewertungsmetriken mIoU 84,60 % bzw. 87,42 %. Die experimentellen Ergebnisse zeigen, dass das vorgeschlagene Modell andere Modelle bei der semantischen Segmentierungsaufgabe für Fernerkundungsbilder übertrifft.