La segmentación semántica de imágenes de teledetección tiene un papel importante en la clasificación del uso y la cobertura del suelo, la planificación urbana y la detección de cambios. La tecnología de adaptación de dominio, como un método de aprendizaje no supervisado muy prometedor, ha impulsado en gran medida el desarrollo de la segmentación semántica de imágenes de teledetección. Sin embargo, los modelos existentes se basan en el aprendizaje de una sola tarea, lo que conduce a características de segmentación insuficientemente aprendidas y dificulta el reconocimiento preciso de regiones complejas en imágenes de teledetección durante el proceso de segmentación. Para resolver este problema, este artículo propone una red de segmentación semántica de adaptación de dominio de aprendizaje multitarea MTLDANet (Muti-Task Learning Domain Adaption Network), que mejora la capacidad de aprendizaje de características de segmentación mediante el aprendizaje colaborativo de la información semántica y de elevación en imágenes de teledetección. En concreto, este método introduce características semánticas y de elevación específicas de la tarea en un módulo de aprendizaje de asociación de características entre tareas para explotar la correlación latente entre tareas, logrando una expresión más fuerte de características específicas de la tarea, y mejora la calidad de las pseudoetiquetas mediante un módulo de aprendizaje de coherencia mixta guiado por pseudoetiquetas, logrando una alineación global y local. Además, un módulo de alineación a nivel de clase guiado por entropía mejora aún más la discriminación de clases difíciles de clasificar. Finalmente, basándose en los conjuntos de datos ISPRS 2D y US3D, se realizaron cuatro grupos de experimentos de segmentación semántica de imágenes de teledetección entre escenas. Los resultados muestran que el método propuesto supera significativamente a los métodos existentes de adaptación de dominio en diversos escenarios transdomainas complejos.
关键词
segmentación semántica; adaptación de dominio no supervisada; imágenes de teledetección; aprendizaje multitarea; información de elevación; información semántica; pseudoetiquetas; entropía