La alta resolución espacial-temporal del índice de vegetación normalizado NDVI (Normalized Difference Vegetation Index) es crucial para la monitorización del crecimiento de los cultivos y la inversión de parámetros. Los datos de teledetección satelital en las bandas roja e infrarroja cercana pueden servir como una importante fuente de datos para el NDVI. Sin embargo, debido a las limitaciones de potencia de los sensores satelitales, generalmente existe una limitación mutua entre la resolución espacial y temporal de los datos de teledetección obtenidos, lo que dificulta la obtención de datos NDVI de alta resolución espacial y temporal. La técnica de fusión espacial-temporal tiene como objetivo fusionar datos NDVI de alta resolución temporal pero de baja resolución espacial y datos NDVI de alta resolución espacial pero de baja resolución temporal, para generar datos NDVI de alta resolución espacial-temporal. Sin embargo, la fusión espacial-temporal del NDVI enfrenta un gran desafío, y es que los datos auxiliares conocidos generalmente presentan grandes variaciones en la cobertura del suelo entre el momento del auxilio y el momento de la predicción. Para enfrentar este desafío, este estudio propone un método de fusión espacial-temporal acoplado con una reconstrucción espacial de datos STFSR (Spatio-Temporal Fusion then Spatial Reconstruction), mediante el aprovechamiento pleno de datos de alta resolución espacial cercanos en el tiempo a momento de la predicción, pero con brechas en los datos (causadas por la cobertura de nubes en las imágenes satelitales), para ayudar en la predicción de la fusión espacial-temporal del NDVI. El experimento seleccionó datos NDVI de tres áreas experimentales en París, Francia, en la provincia de Hebei en China y en el estado de Nueva Gales del Sur en Australia, y los comparó con los modelos de fusión de reflectancia adaptativa espacial y temporal STARFM (Spatial and Temporal Adaptive Reflectance Fusion Model) y de fusión espacial-temporal basada en el peso espacial y las imágenes virtuales VIPSTF-SW (Spatial Weighting-based Virtual Image Pair-based Spatio-Temporal Fusion) para validación. Los resultados muestran que el uso de imágenes auxiliares temporales de nubes reduce de manera efectiva el impacto de la variación del NDVI en la fusión espacial-temporal; en las tres áreas experimentales seleccionadas por este estudio, el método STFSR propuesto demostró ser más preciso que los modelos STARFM y VIPSTF-SW comúnmente utilizados, con una reducción promedio de 0,0217 y 0,0188 respectivamente para el error cuadrático medio RMSE (Root Mean Square Error), un aumento promedio de 0,0820 y 0,0742 para el coeficiente de correlación CC (Correlation Coefficient), una reducción promedio de 4,3170 y 3,8535 para el error de síntesis global relativo ERGAS (Relative Global-dimensional Synthesis Error). Además, cuando la zona nubosa de los datos auxiliares se amplía, el método STFSR muestra una tendencia a la disminución en términos de precisión, pero sigue siendo en general mejor que los métodos STARFM y VIPSTF-SW. El método STFSR ofrece un nuevo enfoque para la generación de datos NDVI de alta resolución espacial-temporal, y dadas sus premisas y ventajas, presenta un potencial de aplicación significativo para otros datos de índices vegetales de alta resolución espacial-temporal, como la generación de índices de vegetación mejorados.