A utilização de imagens ópticas e SAR de sensoriamento remoto para a estimativa da altura dos edifícios é de grande importância para compreender a morfologia urbana e otimizar o espaço urbano existente. No entanto, os conjuntos de dados existentes apresentam diversas limitações: devido ao número reduzido de amostras, é difícil atender às necessidades de extração de informações baseadas em aprendizado profundo, as áreas cobertas pelas amostras são limitadas e não fornecem diversidade geográfica suficiente nem representatividade das características espaciais, especialmente há uma notável falta de conjuntos de dados de altura de edifícios em larga escala para a região chinesa. Além disso, a falta de abertura dos conjuntos de dados limita sua aplicação e validação em pesquisas mais amplas. Para resolver esses problemas, este artigo construiu um conjunto de dados BHDSI (Building Height Estimation Dataset Based on Sentinel Imagery) orientado para aprendizado profundo, que abrange os centros urbanos de 62 cidades chinesas, com um total de 5606 amostras, abrangendo cenas urbanas e rurais, sendo o maior conjunto de dados de altura de edifícios em termos de área coberta na China. Esse conjunto contém imagens de sensoriamento remoto Sentinel-1 e Sentinel-2, bem como valores reais da altura dos edifícios, com tamanho de amostra de 256×256, comparado a conjuntos de 64×64, oferecendo uma opção complementar importante para pesquisa de estimativa de altura de edifícios. Em comparação com outros conjuntos, este possui grande número de amostras, ampla cobertura, acessibilidade e distribuição razoável das alturas dos edifícios, atendendo melhor às necessidades de treinamento de redes profundas. Com base nisso, este artigo avaliou o conjunto BHDSI e outros conjuntos similares utilizando as mesmas redes de aprendizado profundo, comparando o desempenho de várias redes na tarefa de regressão da altura dos edifícios usando BHDSI, e analisando profundamente as vantagens e desvantagens de cada rede. Os resultados mostram que o BHDSI apresenta desempenho superior em regressão de altura de edifícios comparado a outros conjuntos. Análises adicionais revelaram que, ao usar BHDSI, a precisão da estimativa é maior em áreas com edifícios mais baixos. Além disso, o uso do decodificador U-Net para treinar redes de estimativa de altura de edifícios alcança maior precisão. Em resumo, o conjunto BHDSI fornece suporte importante para pesquisas futuras no campo da estimativa de altura de edifícios.
关键词
imagens sentinel; altura de edifícios; conjunto de dados; aprendizado profundo; redes neurais convolucionais