Дистанционные изображения характеризуются значительными различиями в размерах объектов, сложным и изменчивым фоном, наличием спектральных смешений элементов и нечеткими границами признаков, что увеличивает сложность задачи семантической сегментации. Для решения проблемы сложности семантической сегментации объектов дистанционных изображений, вызванной взаимозависимостью признаков при различных условиях освещенности, в данной работе предлагается модель семантической сегментации дистанционных изображений на основе раззапутывания. Модель состоит из сети раззапутывания отражения освещения (LRD-Net) и многомодальной сети семантической сегментации (MSS-Net). Во-первых, на основе теории Retinex разработана сеть LRD-Net для разложения оптического изображения на компоненты освещения и отражения с использованием трансформера с разделяемыми весами (WS-Transformer) для извлечения глобальных и локальных признаков объектов. Во-вторых, введён мультимасштабный шумовой модуль для адаптивного усиления компонента освещения с целью улучшения способности модели к раззапутыванию; модуль усиления значимых признаков (SE) выделяет различия между признаками различных компонентов. В-третьих, модуль извлечения краевых признаков (EE) улучшает распознавание краев объектов дистанционного зондирования, а многомодальная сеть семантической сегментации (MSS-Net) интегрирует признаки освещения и отражения для повышения эффективности семантической сегментации. На общих наборах данных ISPRS Vaihingen и ISPRS Potsdam метрика mIoU достигла соответственно 84,60% и 87,42%. Экспериментальные результаты показывают превосходство предложенной модели в задаче семантической сегментации дистанционных изображений по сравнению с другими моделями.