Die Detektion semantischer Änderungen in Fernerkundungsbildern spielt eine wichtige Rolle bei der Überwachung der ökologischen Umgebung, der Landnutzung und der Überwachung ihrer Abdeckung. In den letzten Jahren sind Methoden zur Detektion von Änderungen auf der Grundlage des Deep Learning ein Schwerpunktthema in der intelligenten Interpretation der Fernerkundung, jedoch fehlt es den aktuellen Methoden zur halbverknüpften Änderungserkennung an der Modellierung der Kohärenz zwischen dem Änderungszweig und dem Semantikzweig, was zu einem inneren Widerspruch bei der halbverknüpften semantischen Änderungserkennung führt. Zur Lösung dieses Problems wird in diesem Artikel ein Algorithmus zur Detektion semantischer Änderungen in Fernerkundungsbildern vorgeschlagen, der auf einem zweifachen CNN und Transformer basiert. In der Codierungsphase wird zunächst ein zweifaches ResNet34-Netzwerk entworfen, um mehrskalige Merkmale der Bilder zu extrahieren und ein Differenzverstärkungsmodul zur Erhöhung der Aufmerksamkeit auf die Änderungsinformationen zu integrieren; dann werden über einen semantischen Marker die Merkmalskarten der Bilder als kompakte semantische Token abgebildet und über einen Transformer-Encoder kombiniert, um die Kohärenz Semantik-Änderung bei den halbverknüpften semantischen Änderungen zu modellieren. In der Decodierungsphase werden über einen Transformer-Decoder mit Hilfe von Sprungverbindungen unterschiedliche präzise semantische Informationen fusioniert und präzise semantische Merkmalskarten generiert; anschließend wird über eine Upsampling-Wiederherstellung eine Maskenmultiplikation durchgeführt, um verschiedene Ergebnisse der halbverknüpften semantischen Änderungserkennung zu erhalten. Die Ergebnisse der Experimente auf den öffentlichen Datensätzen zur Änderungserkennung SECOND und LandSat-SCD zeigen, dass der in diesem Artikel vorgeschlagene Algorithmus effektiv auf Änderungsbereiche fokussieren, die Kohärenz zwischen den Änderungsergebnissen und den semantischen Ergebnissen aufrechterhalten und ausgezeichnete Bewertungskennzahlen und visuelle Effekte erzielen kann.