تحتاج كشف الأهداف بالضوء المرئي في ظروف معقدة مثل الحجب والضوء الضعيف إلى تأثير سهولة غنى السمات، مما يؤدي إلى خفض دقة كشف الأهداف، في هذا البحث تم إدخال صور الأشعة تحت الحمراء لسد النقص في صور الضوء المرئي، ويقدم البحث طريقة كشف أهداف متعددة الوسائط تتكيف بسمات الضوء المرئي والأشعة تحت الحمراء. تستخدم هذه الطريقة إطار الكشف عن الأهداف YOLOv8 كأساس لاستخراج معلومات السمات متعددة المقياس. بناءً على ذلك، استنادًا إلى أن شكل الضوء المرئي له ميزات نسيجية أكثر غنى فإن الصور الحمراء لها حافة أكثر وضوحًا من سمات النسيج، يتم بناء وحدة الاهتمام المختلطة متعددة الوسائط للتواصل وإعادة ترتيب وزن المعلومات عبر الوسائط لتحقيق المزايا في السمات في ظروف الإضاءة المختلفة. ثم، باستخدام غنى سمات الضوء المرئي وشدة الإضاءة البيئية الدالة، يتم تصميم وحدة توزيع الوزن الديناميكي للضوء المرئي - الحمراء، ويتم دمج الوزن كمرجع، ويتم إدراج الوزن في وحدة الاندماج متعددة الوسائط للانصهار التلقائي لتحقيق الكشف عن الأهداف بناءً على السمات متعددة الوسائط. في النهاية، يوضح التجارب على مجموعة بيانات المشهد الشارعي M3FD ومجموعة بيانات مركبات الطائرات بالطائرات Pilot Vehicle أن الأسلوب المقترح في هذا البحث يمكن أن يحصل على دقة كشف أعلى مقارنة بالخوارزميات الحالية لكشف الأهداف المفردة ومتعددة الوسائط في الفحص.
关键词
كشف الأهداف; متعددة الوسائط; الشبكات العصبية الاصطناعية; انصهار السمات; آلية الانتباه; صور الضوء المرئي; الصور الحمراء; التعلم العميق