No campo do aprendizado profundo, o desempenho dos modelos de detecção de objetos geralmente depende da disponibilidade de dados de amostragem suficientes e conjuntos de dados anotados de alta qualidade. No entanto, na prática da detecção arqueológica por sensoriamento remoto, é difícil e caro obter conjuntos de dados grandes e diversificados, o que resulta em escassez de amostras e os modelos tendem a sobreajustar durante o treinamento. Especialmente quando as condições ambientais dos túmulos variam significativamente, as diferenças na quantidade de amostras entre os ambientes causam uma distribuição desigual das amostras, limitando a capacidade do modelo de se adaptar ao ambiente. Para isso, este artigo propõe um algoritmo de aumento de dados de imagens de sensoriamento remoto baseado em modelos de difusão. O algoritmo usa um modelo de difusão ajustado, combinando padrões fractais e cadeias de aumento de imagens aleatórias, e ao configurar diferentes prompts ambientais, enriquece a semântica visual das imagens sem prejudicar a distribuição das etiquetas do conjunto de dados original, aliviando o problema da escassez e desequilíbrio de amostras. O desempenho do algoritmo foi avaliado em um conjunto de dados de imagens de túmulos de alta resolução da região de Altai construída internamente, comparado com algoritmos clássicos de aumento de dados. Os resultados mostram que o algoritmo proposto aumentou a precisão média no conjunto de teste em 12,2% e no conjunto de dados heterogêneo em 16,4%, melhorando significativamente a precisão, estabilidade e adaptabilidade do modelo em diferentes conjuntos de dados, fornecendo suporte técnico eficaz para o reconhecimento de alvos arqueológicos por sensoriamento remoto com poucos exemplos e expandindo as ideias de pesquisa para detecção arqueológica inteligente.
关键词
aprendizado profundo; detecção de túmulos; aumento de dados; modelo de difusão; arqueologia por sensoriamento remoto; aprendizado com poucos exemplos; aumento semântico ambiental