مع تكامل تقنيات الاستشعار عن بعد والذكاء الاصطناعي، زادت حاجة الإنسان لتطبيقات البيانات الرمزية بشكل دقيق. ومع ذلك، تواجه البيانات الأحادية النمطية قيودًا في تفسير السياقات المعقدة، ومن الصعب استخلاص المعلومات العميقة من الصور البيانية. لهذا السبب، أصبح تحليل البيانات متعددة الوضائف مفتاحًا لتعزيز قدرة تفسير البيانات الرمزية، ويعزز تطور مجال الاستشعار عن بعد. يعتمد فهم الصور نصيًا بشكل رئيسي على إنشاء صلة بين الصور البيانية والإدراك البشري من خلال الوصف النصي، ويستفيد من المعلومات الدلالية للنص لتعزيز تمثيل السمات البصرية، وتحقيق إضافة متبادلة للمعلومات عبر الأوضاع. هذا يؤدي إلى تحسين أداء تفسير البيانات الرمزية بشكل كبير. يقسم هذا المقال فهم الصور البيانية النصيّة عبر الأوضاع بمجال الاستشعار البعيد إلى أربع مهام، وهي وصف الصور البيانية، وتوليد النصوص للصور البيانية، ومضاهاة الصور البيانية والنصوص، وسؤال الصور البيانية. يلخص المقال أولاً حالة البحث الحالية لفهم الصور البيانية النصية عبر الأوضاع في الداخل والخارج؛ ثانيًا، يقدم المقال المجموعات البيانية العامة الشائعة والمقاييس لتقييم فهم الصور البيانية النصية عبر الأوضاع؛ أخيرًا، يُلخص المقال التحديات التقنية التي تواجه فهم الصور البيانية النصية عبر الأوضاع، ويتطلع إلى اتجاهات البحث المستقبلية.
关键词
فهم الصور البيانية النصية عبر الأوضاع؛ وصف الصور البيانية؛ توليد النصوص للصور البيانية؛ مضاهاة الصور البيانية والنصوص؛ سؤال الصور البيانية؛ مجموعة بيانات الاستشعار البعيد العابرة للأوضاع