다중 모달 데이터 및 다중 모델 융합 기반 대규모 토지 피복 지도 작성

RU Yifan ,  

TANG Guoliang ,  

LI Chunlai ,  

摘要

현재 토지 피복 지도 작성은 단일 데이터 소스 정보의 한계, 데이터 이질성, 단일 모델의 일반화 능력 부족 등 핵심적인 도전에 직면해 있습니다. 이에 본 연구는 다중 분광 영상(MSI, Multispectral Imagery)의 스펙트럼 특성과 합성 개구 레이더(SAR, Synthetic Aperture Radar)의 서로 다른 특성을 기반으로, 다중 모달(MSI+SAR) 데이터셋을 구축하여 복잡한 환경에서 단일 모달 SAR 데이터의 한계를 보완하였습니다. 또한, 모델 수준에서 7종의 대표 모델을 체계적으로 평가한 후, 세 가지 아키텍처를 융합하는 다중 모델 융합 방법을 제안하였습니다: FCN은 합성곱 신경망(CNN)을, ConViT는 비주얼 트랜스포머(ViT)를, CoAtNet은 CNN-ViT 혼합 아키텍처를 대표합니다. 실험 결과 다중 모달(MSI+SAR) 데이터는 단일 모달 SAR 데이터보다 전체 정확도(OA)와 빈도 가중 교차 비율(FWIoU) 두 가지 대표적인 의미 분할 평가 지표에서 유의미한 향상을 보였으며, 제안된 다중 모델 융합 프레임워크는 OA와 FWIoU 두 지표에서 추가적인 개선을 이루었습니다. 본 연구에서 제안한 혁신적인 방법은 모델의 복잡한 지형 특성 추출 능력을 강화할 뿐만 아니라, 대규모 토지 피복 지도 작성에서의 분류 성능을 효과적으로 향상시켜, 다중 모달 데이터와 다중 모델 융합이 원격탐사 지도 작성에서 강력한 잠재력을 가짐을 입증하였습니다.

关键词

토지 피복 지도;다중 분광;합성 개구 레이더;다중 모달;다중 모델 융합;합성곱 신경망;비주얼 트랜스포머

阅读全文