تعزيز دقة كشف النصوص المزيفة العميقة باستخدام التعلم العميق وتقنيات المعالجة المسبقة

علي  حنقة; وسام الترجمان

doi:10.36602/ijeit.v12i1.500

المؤلفون

علي محمد حنقة كلية تقنية المعلومات
وسام الترجمان كلية تقنية المعلومات

DOI:

https://doi.org/10.36602/ijeit.v12i1.500

الكلمات المفتاحية:

كشف النصوص المزيفة العميقة، النماذج اللغوية الكبيرة (LLMs)، تقنيات المعالجة المسبقة للنصوص، المحولات Transformers، التعلم العميق (BiLSTM , CNN

الملخص

شهدت التطورات الأخيرة في النماذج اللغوية الكبيرة (Large language models - LLMs) تقدمًا كبيراً في توليد النصوص المشابهة للنصوص البشرية. تميزت هذه النماذج بقدرات كبيرة في كتابة محتوى متنوع مثل المقالات الإخبارية والقصص والنصوص العلمية. هذا يؤكد أهمية اكتشاف هذه النصوص لتجنب المخاطر المحتملة كإنتشار الأخبار المزيفة والسرقة الأدبية وضمان سلامة النص في مجالات مختلفة مثل القانون والتعليم والعلوم.

في بداية بحثنا هذا كان اكبر تحديً لنا هو عدم وجود مجموعة بيانات تحتوي على نصوص عربية مزيفة وحقيقية وكانت مجموعة بيانات النصوص الإنجليزية المتوفرة قديمة ومحدودة وتحتاج لتحديث. بناءاً عليه جمعنا نصوصا عربية وانجليزية مكتوبة بشرياً وانتجنا نصوصاً مزيفة من خلال نماذج لغوية كبيرة. قمنا ببناء نموذجين مختلفين لكشف النصوص الانجليزية والعربية المزيفة العميقة. استخدمنا في النموذج الأول تقنيات المعالجة المسبقة وخوارزمية (long short-term memory network - LSTM). وقد حقق النموذج دقة عالية في كشف النصوص الانجليزية بلغت 96% و 56% للنصوص العربية.

التنزيلات

تنزيل البيانات ليس متاحًا بعد.

تعزيز دقة كشف النصوص المزيفة العميقة باستخدام التعلم العميق وتقنيات المعالجة المسبقة

المؤلفون

DOI:

الكلمات المفتاحية:

الملخص

التنزيلات

التنزيلات

منشور

إصدار

القسم

الرخصة

كيفية الاقتباس

المؤلفات المشابهة

الأعمال الأكثر قراءة لنفس المؤلف/المؤلفين

الرقم التسلسلي القياسي الدولي

توثيق رقمي عبر Crossref

الحفظ الرقمي عبر Portico

دليل المجلات الليبية الإلكتروني

معامل التأثير العربي

تحقق من الانتحال عبر Turnitin

الفهرسة في

تنشر بواسطة

الجهات الداعمة

اللغة