BHDSI:深層学習に向けたリモートセンシング建築高さデータセット(5606)

WANG Hao ,  

MA Yao ,  

CAO Changhao ,  

NING Xiaogang ,  

ZHANG Hanchao ,  

ZHANG Ruiqian ,  

摘要

現在の中国地域の建物の高さのリモートセンシングデータが不足している問題に対処するために、本研究では、深層学習建築高さ推定タスク向けの大規模データセットを構築しました。光学とSARリモートセンシング画像を使用して建築高さを推定することは、都市形態の理解と都市在庫空間の最適化に重要です。しかし、既存のデータセットには多くの制限があります:サンプル数が少ないため、深層学習に基づくリモートセンシング情報の抽出要件を満たすのが難しいです。サンプルがカバーする領域が非常に限られており、十分な地理的多様性と空間特徴の代表性を提供できないため、特に中国地域の大規模建築高さデータセットが不足しています。さらに、データセットのオープンソース化が不十分なため、より広範囲の研究での適用と検証が制限されます。これらの問題を解決するために、本論文では、中国の62の主要都市の中心部をカバーする建築高さ回帰に重点を置いたBHDSIデータセットを構築しました。このデータセットには、城市、農村など5606のサンプルが含まれており、サイズは256×256です。64×64のデータセットと比較して、建築高さ推定の研究に重要な選択肢を提供しています。他のデータセットと比較して、このデータセットはサンプル数が多く、範囲が広く、建築高さの分布が合理的な特徴を持っています。これにより、深層学習ネットワークのトレーニング要件をよりよく満たすことができます。これに基づいて、本研究では、BHDSIデータセットと他の類似のデータセットに対して同じ深層学習ネットワークを使用して評価し、BHDSIデータセットを使用した場合の建築高さ回帰タスクのさまざまなネットワークのパフォーマンスを比較し、各ネットワークの優劣を詳細に分析しました。研究によると、他のデータセットと比較して、BHDSIデータセットは建築高さ回帰タスクでより優れたパフォーマンスを示しています。さらに分析すると、BHDSIデータセットを使用すると、建築高さが低い地域でより高い精度が得られます。また、建築高さ推定ネットワークのトレーニングにU-Netデコーダーを使用すると、より高い精度が得られます。このデータセットと実験結果は、将来の建築高さ推定分野の研究に重要なサポートを提供します。

关键词

センチネルイメージ;建築物の高さ;データセット;深層学習;畳み込みニューラルネットワーク

阅读全文