كشف الوسائط المزيفة: دراسة شاملة للنماذج الضخمة لرؤية الحاسوب في كشف التزييف العميق

نوع المستند : المقالة الأصلية

المؤلفون

1 قسم علوم الحاسب، کلية الحاسبات والذکاء الاصطناعى، جامعة حلوان، القاهرة، مصر

2 كلية تكنولوجيا المعلومات وعلوم الحاسب، جامعة النيل، الجيزة، مصر

3 قسم علوم الحاسب، کليه الحاسبات والذکاء الاصطناعى، جامعة حلوان، القاهرة، مصر

المستخلص

تُعَدُّ مقاطع الفيديو الرقمية من أكثر أنواع الوسائط المتعددة انتشاراً في الحياة اليومية، حيث يتم تداولها على نطاق واسع عبر قنوات التواصل الاجتماعي مثل فيسبوك، وإنستجرام، وواتساب، ويوتيوب من خلال الإنترنت. وقد أدت التطورات السريعة في مجالات الذكاء الاصطناعي، وتعلم الآلة، والتعلم العميق إلى تطوير تقنيات وأدوات متقدمة للتلاعب بالوسائط المتعددة. ولقد سهلت هذه الابتكارات التكنولوجية إنشاء صور ومقاطع فيديو رقمية مزيفة، مما جعل اكتشاف هذا التلاعب أمراً بالغ الأهمية ويتطلب دراسة شاملة لمنهجيات كشف التزييف الحالية. تقدم دراستنا الاستقصائية الشاملة تصنيفاً لهذه المنهجيات عبر ثلاثة مجالات رئيسية: المرئية، والصوتية، والمجالات المتعددة الوسائط السمعية والبصرية. تستعرض الدراسة استراتيجيات كشف التزييف العميق بتركيز خاص على تطبيق تقنيات التعلم العميق الحديثة، وتحديداً نماذج الرؤية الكبيرة. تشمل الدراسة تحليلاً مقارناً معمقاً لأساليب التعلم العميق المختلفة، مع التركيز على نماذج الرؤية الكبيرة، وتظهر تفوق أدائها مقارنةً بالتقنيات السابقة. يعتمد هذا التحليل على عدة مقاييس ومجموعات بيانات داعمة. بالإضافة إلى ذلك، تقدم الدراسة حلولاً جديدة وتوجهات بحثية مستقبلية في مجال الكشف متعدد الوسائط عن التزييف العميق، من خلال استكشاف أبعاد جديدة للتلاعب بالفيديو مثل التراكبات النصية وديناميكيات الحركة. كما تبرز الأهمية المتزايدة لتوسيع دور النماذج الكبيرة للرؤية وتؤكد على ضرورة تطوير مجموعات بيانات شاملة ومتنوعة لتعزيز قوة وفعالية تقنيات الكشف.

الكلمات الرئيسية

الموضوعات الرئيسية