Este artículo aborda dos problemas difíciles de extracción de edificios, a saber, la variabilidad de la forma y la extracción imprecisa de los contornos. Propone una red integrada de extracción de edificios de doble rama para separar las estructuras principales y extraer información a múltiples escalas. En primer lugar, utilizando el concepto de descomposición y la tecnología de flujo óptico, se diseña una rama de separación de las estructuras principales para obtener las características principales y los contornos de los edificios, mejorando así la representación de los contornos de los edificios. Luego, utilizando convoluciones dilatadas, convoluciones profundas separables y un mecanismo de atención, se construye una rama ligera de extracción de información a múltiples escalas para extraer completamente las características de los edificios a diferentes escalas. Finalmente, utilizando las características principales y los contornos obtenidos, se propone una función de pérdida reforzada asistida por las características principales y los contornos para optimizar el proceso de entrenamiento de la red. Los resultados de los experimentos en conjuntos de datos públicos de extracción de edificios muestran que la red de extracción de edificios propuesta es efectiva y factible.
关键词
imágenes de satélite; extracción de edificios; aprendizaje profundo; U-Net; separación de las estructuras principales; doble rama; multi-escala; modelo ligero