Obwohl Deep-Learning-Methoden gute Ergebnisse bei der feinkörnigen Extraktion der Anbauverteilung auf Feldparzellenebene mittels Fernerkundung zeigen, sind sie stark von einer großen Anzahl qualitativ hochwertiger annotierter Proben abhängig, was hohe Kosten, geringe Aktualität und eingeschränkte Generalisierungsfähigkeit über Regionen hinweg mit sich bringt. Daher wird in diesem Artikel eine Methode zur Optimierung der Hinweisinformationen für die Feldparzellensegmentierung vorgestellt, welche visuelle Basismodelle mit Wissensfusion kombiniert. Die Phänologie des Reises und spektrale Indizes werden durch adaptives iteratives Lernen in dynamische Hinweisinformationen umgewandelt, die das visuelle Basismodell benötigt, und lösen somit effektiv das Problem der hohen Probenabhängigkeit herkömmlicher Deep-Learning-Methoden. Konkret wird zunächst das Wissen über Vegetationsindizes verwendet, um Nicht-Vegetationsbereiche auszuschließen und den Rechenaufwand zu reduzieren. Gleichzeitig werden anhand der vorläufigen SAM-Segmentierungsergebnisse pro Parzelle statistische Auswertungen durchgeführt, um den Schwellenwertbereich des Vorwissens zu aktualisieren, welche als Hinweise für die Parzellensegmentierung erneut in das SAM-Modell eingespeist werden. Durch dieses iterative Lernen werden das Vorwissen aktualisiert und die besten Klassifikationsergebnisse auf Parzellenebene erzielt. Abschließend schlägt die Methode innovativ vor, den IoU-Indikator als Abbruchbedingung für die iterative Segmentierung zu verwenden, wodurch ein adaptiver Lernkreislauf mit Präzision und Effizienz entsteht, der eine quantitative Überwachung der Stabilität der Segmentierungsergebnisse ermöglicht und ein automatisches Beenden des Modells bei Erreichen der optimalen Lösung gewährleistet. Experimentelle Ergebnisse zeigen, dass die Reiserntesaison das beste Zeitfenster für die Extraktion ist; basierend auf dieser optimalen Phase lagen die kartographischen Kappa-Koeffizienten in verschiedenen Versuchszentren wie dem Ninghe-Bezirk in Tianjin, der Stadt Fujin in Heilongjiang und der Stadt Niigata in Japan bei jeweils 0,89, 0,91 und 0,86. Außerdem erzielt die Methode im Vergleich zu typischen überwachenden Lernmodellen wie U-Net und DeepLabV3+ eine vergleichbare oder sogar höhere Extraktionsgenauigkeit, ohne dass ein speziell auf das Untersuchungsgebiet zugeschnittenes Modell trainiert werden muss, was die Wirksamkeit und die regionale Generalisierungsfähigkeit der Methode bestätigt und eine neue Lösung für die großflächige, kostengünstige und hochpräzise automatisierte Erntekartierung bietet.