استخدام نحو اللغة العربية الوظيفي في تحسين استخراج المعلومات من النص العربي غير المهيكل
Main Article Content
Abstract
ينشر – يومياً - كم هائل من المعلومات على شبكة الإنترنت في أشكال متعددة، وثائق، مدونات...إلخ عبر شبكات التواصل الاجتماعي. وبما أن معظم هذه البيانات متاحة في شكل وثائق غير منظمة، فإنه من الصعب البحث في هذا الكم الهائل من البيانات والوصول إلى نتائج محددة ومفيدة فضلا عن إنفاق الوقت الطويل في ذلك. وبالتالي، فإن البحث والوصول إلى المعرفة المفيدة من هذه البيانات والنصوص غير المهيكلة تتزايد أهميته كل يوم.
يركز هذا العمل على استخلاص المعلومات من النص العربي غير المهيكل الموجود على شبكة الانترنت وهي مهمة صعبة خاصة إذا كنا نروم الوصول إلى معلومات عن طريق التحليل للمستويات الصرفية-النحوية والدلالية والتداولية للغة العربية. ومما يزيد من صعوبة المهمة وتعقيد المشكلة عدم وجود بحوث متقدمة في هذا المجال بالنسبة للغة العربية بالمقارنة مع اللغات الأوروبية مثلا.
الهدف الرئيسي من هذا العمل البحثي هو تقديم منهجية شاملة لاستخراج المعلومات من النصوص العربية غير المهيكلة الموجودة على شبكة الانترنت باستخدام تقنيات معالجة اللغات الطبيعية التي ثبتت فعاليتها في حل معظم مشاكل التصنيف من أجل تحسين عملية استخراج المعلومات من النصوص والوثائق غير المهيكلة على الانترنت.
تكمن أهمية أدوات هذه البرمجة في كونها تلعب دورا رئيسيا في تيسير الوصول إلى تعيين ووسم المفردات بناء على دلالتها في النصوص غير المهيكلة، لنتمكن بعد ذلك من الوصول إلى الغاية الكبرى وهو الويب الدلالي. ويعرض هذا العمل نهجا قائما على قواعد جديدة – على مستوى معالجة اللغة العربية حاسوبيا - باستخدام تقنيات علم اللسانيات، وتحديدا نظرية النحو الوظيفي لسيمون ديك، متخذا من المستوى الدلالي للغة موضوعا لهذا البحث، كما يسهم بحثنا في تطبيق نهج جديد فيما يتعلق باستخراج العلاقات من النص العربي غير المنظم في المجال الاقتصادي التي تعتبر واحدة من أهم البيانات غير المهيكلة التي يتم نشرها يوميا على الانترنت، بالاعتماد على نظرية النحو الوظيفي.
Article Details
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.