النموذج البولياني

النموذج البولياني بعتبر من النماذج التقليدية في استرجاع المعلومات ،فهو أول نموذج مستخدم في نظم استرجاع المعلومات ويعتبر من أكثر النماذج التي تم الاعتماد عليها. وهو يستخدم من قبل جميع أنظمة استرجاع المعلومات التجارية اليوم.  

تمثيل للنموذج البولياني بأقراص ذات أقطار عشوائية.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

تعاريف

يستند هذا النموذج بشكل أساسي على المنطق البولياني ونظرية المجموعات وذلك بأنه يعتبر أن الوثائق التي سيبحث النظام خلالها واستعلام المستخدم كلاهما عبارة عن مجموعة من المصطلحات، ويتم استرجاع وثيقة ما في حال كانت مصطلحات الاستعلام موجودة في هذه الوثيقة. لو اعتبرنا المجموعة T

T = {t1, t2, ..., tj, ..., tm}

مجموعة منتهية من العناصر والتي نسمي كل منها مصطلح فهرسة (index term) (والتي قد تكون كلمات أو حتى تعابير، والتي قد تكون تمت عليها عملية تجذير(stemming)، كما أنها قد تكون كلمات مذكورة في المقالة أو حتى من المعطيات المترفعة(metadata)التي تصف الوثيقة). والمجموعة D

D = {D1, ..., Di, ..., Dn}

هي مجموعة منتهية تمثل الوثائق، كل عنصر منها عبارة عن مجموعة جزئية من T وذلك لأن الوثيقة تتألف من عدد من المصطلحات أو الكلمات(terms). وسنعرف التعبير Q التالي

Q = (Wi OR Wk OR ...) AND ... AND (Wj OR Ws OR ...)

بأنه استعلام المستخدم والذي يكتب بالطريقة الطبيعية الأساسية لأي تعبير بولياني في المنطق البولياني ، وذلك بحيث أن:

Wi=ti, Wk=tk, Wj=tj, Ws=ts, or Wi=NON ti, Wk=NON tk, Wj=NON tj, Ws=NONts

أي أنه إما أن تكون كلمات الاستعلام غير مسبوقة بإشارة نفي وهي بذلك تعني أن المستخدم يطلب البحث عن الوثائق التي تحتوي هذه الكلمة، أو أنها تكون مسبوقة بإشارة النفي والتي تعني أن المستخدم يحتاج البحث عن المقالات التي لا تحوي هذه الكلمة. وبشكل مكافئ يمكن أن يكون الاستعلام مكتوب باللغة الطبيعية ليعبر عن احتياج المستخدم. عملية الاسترجاع تتألف من مرحلتين هما:

  1. الحصول على المجموعات Sj من الوثائق والتي إما أن تحوي كلمات الاستعلام أو لا تحويها وذلك بحسب الاستعلام ذاته أي فيما إذا كانت كلماته بالشكل (Wj=tj) أو (Wj=NON tj).

Sj = {Di|Wj element of Di}

  1. تتم عملية استرداد الوثائق المجيبة للاستعلام والتي تم الحصول عليها بعد تطبيق العمليات على المجموعات Sj بالشكل الموافق للاستعلام Q أي بالشكل

اتحاد (التقاطعات من Sj).


مثال توضيحي

إيجابيات النموذج البولياني

  1. سهل التطبيق
  2. يصاغ الاستعلام بشكل واضح ومعبر عن طلب المستخدم بدقة

سلبيات النموذج البولياني

  1. يعتمد على المطابقة التامة بين كلمات الاستعلام وكلمات الوثائق وهذا يؤدي إلى استرجاع عدد قليل جداً من الوثائق أو على العكس تماماً.
  2. من الصعب القيام بعملية ترتيب لنتائج البحث، مع أن بعض الوثائق المسترجعة قد تكون أهم من غيرها ولكن لا تأخذ ترتيب أعلى.
  3. قد يجد المستخدم صعوبة في صياغة الاستعلام بالشكل المطلوب.
  4. جميع كلمات الفهرسة لها أوزان متساوية.
  5. يعتبره البعض أنه أقرب إلى استرجاع البيانات (Data Retrieval) منه إلى استرجاع المعلومات (Information Retrieval).


الهامش

الكلمات الدالة: