LAE-Transformer: сеть сегментации ЛиДАР-облаков точек с улучшенным локальным восприятием

KU Minfan ,  

ZHANG Liang ,  

Deng Jiwei ,  

WANG Guangshuai ,  

WANG Xinwen ,  

LIU Hengzhi ,  

摘要

Для решения проблемы недостаточного использования локальной топологической информации объектов, слабой способности выражения признаков различных масштабов и неудовлетворительных результатов сегментации маломасштабных объектов с помощью существующих алгоритмов глубокого обучения на основе аэрокосмических ЛиДАР-облаков точек предложена сеть сегментации ЛиДАР-облаков точек LAE-Transformer с улучшенным локальным восприятием. Вначале извлекаются поверхностные топологические признаки для создания локальной геометрической структуры облака точек, повышающей способность модели улавливать детали объектов; затем чередуются модули дискретизации и совместное использование областей точек и трансформатор для извлечения глубоких признаков облака точек, улучшающих способность модели восприятия признаков на многих масштабах; наконец, в процессе увеличения применяется динамическое соединение остатков для адаптивного объединения ключевой информации на различных радиусах восприятия; Кроме того, разработан смешанный слой пулинга на основе механизма внимания и максимального пулинга для устранения проблемы потери информации. Результаты тестирования на наборах данных точечных облаков DALES и LASDU показывают, что общая точность сети в данной работе (OA) и средний пересечение (mIoU) составляют соответственно 97,8% и 80,8%, 87,2% и 68,5%, причем значения пересечения (IoU) для маломасштабных объектов таких как грузовики, электропровода и заборы на наборе данных DALES составляют 42,1%, 75,4% и 63,8%, что превосходит большинство других сетей. Это подтверждает надежность сети в задаче сегментации облаков точек ЛиДАРа.

关键词

ЛиДАР-облака точек; глубокое обучение; семантическая сегментация; самовнимание; усиление локального восприятия; сложные сцены; маломасштабные объекты; трансформатор

阅读全文