كيف أقوم بعملية السمح الأدبي واستخراج المعايير؟


الخلاصة - ٥

في هذه التدوينة سنقوم بعمل مسح أدبي للورقة العلمية المذكورة في التدوينة السابقة واستخراج معايير المقارنة منها.

( Classification Of Arabic Questions Using Multinomial Naive Bayes And Support Vector Machines)

للباحث د. وهيب أحمد. (رابط الورقة العلمية)

المسح الأدبي

في المسح الأدبي للورقة العلمية يتم التركيز على قسمي "المنهجية المقترحة والنتائج"، كما ذُكر في التدوينة السابقة أن الباحث يذكر في المنهجية المقترحة معظم المعلومات المتعلقة بالمشروع والتي على أساسها يتم استخراج معايير المقارنة وكتابة ملخص عن الورقة العلمية. لا يعني أن الأقسام الأخرى لا تحتوي على معلومات تفيد في كتابة الملخص، ولكن ليست بوفرة المعلومات الموجودة في قسم المنهجية المقترحة. بعد أن تتم قراءة الورقة تقوم بتحديد المعلومات التي حصلت عليها سواًء من قسم المنهجية المقترحة والنتائج أو من أي قسم آخر تشعر أنه يحتوي على معلومة تختص بمشروعك، ومن ثم تقوم بعملية تكوين نص من هذه المعلومات وربطها ببعض في جمل لكتابة ملخص عن الورقة العلمية.


في البداية، عند كتابة الملخص تحتاج إلى كتابة كلمة أو جملة استهلالية، هذه الكلمة أو الجملة تعتمد على نوعية الإضافة التي قدمها البحث في المجال. فمن خلال تجربتنا وجدنا أن الأوراق العلمية التي تُنشر في مجال معين إما أن تكون:

  1. بحث استخدم منهجية جديدة لم يسبقه أحد لحل مشكلة.

  2. تم استخدام منهجية موجودة مسبقًا وتقييمها على بيانات جديدة.

  3. إضافة ميزة جديدة على منهجية موجودة سابقًا من أجل تحسينها أو تطويرها.

  4. بحث تم على منهجية مسبقة ولكن باستخدام أدوات وخوارزميات جديدة.


    وقد يكون هناك أنواع أخرى من الأبحاث لم نصادفها بعد. هذه بعض الكلمات والجمل الاستهلالية والتي يمكن استخدامها للبدء بالتحدث عن الورقة العلمية:

-Proposed

-Presented

-Used

-Introduced

-Proposed/Presented/Introduced a novel approach

-Proposed/Presented/Introduced a new approach/ method

-Evaluated the proposed model

-The proposed model by …


ومن ثم تُعقب الجملة الاستهلالية بالمنهجية المتبعة في المشروع، ثم يتم ذكر التفاصيل المستخدمة في المشروع ويُختم الملخص بذكر النتائج.

لنقوم عمليًا بمسح أدبي للورقة المذكورة بالأعلى.


أولاً: نقوم بجمع المعلومات عن المشروع من قسم المنهجية المقترحة والنتائج والأقسام الأخرى إن وجد:


ثانياً: بعد أن قمنا بتحديد المعلومات التي سنستعين بها لكتابة ملخص للورقة في الخطوة السابقة، نقوم الآن بعملية تكوين الملخص.


بعد تطبيق الخطوات السابقة نصل إلى هذه المسودة الأولية لملخص الورقة العلمية المختارة.


Waheeb and Babu [1] Proposed Support Vector Machine (SVM) and Multinomial Naïve Bayes (MNB) algorithms to classify the given question. They used 300 questions from the Arabic Wikipedia as a training dataset, and 200 questions translated to Arabic language from Text Retrieval Conference (TREC 10) as a testing dataset. Their classifier can classify the questions into 8 types: (Who) من, (When) متى, (Where) أين, (What) ماهو-ماهي, (How many) كم عدد, (How much) كم كمية, (How) كيف, (Why) لماذا. They used 1-gram and 2-gram features for training phase, and obtained accuracy scores as follows: 97%, 95% for SVM and MNB respectively.

نلاحظ وجود رقم بعد أسماء المؤلفين وهو ما يعرف ب الاستشهاد Citation. الاستشهاد هو ذكر لمرجع الورقة العلمية التي تم تلخيصها ويتم إدراج هذا المرجع في نهاية البحث في قائمة المراجع، حتى يتسنى للمهتمين من الحصول على معلومات عن البحث. هناك عدة طرق لكتابة الاستشهاد، منها: IEEE, APA, … .

معايير المقارنة

بعد عملية التلخيص نستطيع الآن استخراج المعايير مبدئيًا، ووضعها في جدول للمعايير المستخرجة من كل ورقة علمية.

Join