ترتيب الصفحة

إن عملية بحث عن عبارة معينة باستخدام أي محرك بحث مثل جوجل تعيد عدداً كبيراً من الصفحات، مثال: البحث عن "weather forecast" يعيد 5.5 مليون صفحة، على الرغم من العدد الكبير الذي تعيده محركات البحث كرد على استعلام معين فإن الصفحات الأكثر تعلقاً بالاستعلام المطلوب ستظهر في النتائج العشرة أو العشرين الأوائل، والتي يكتفي طالب الاستعلام بالنظر إليها ويقوم بتجاهل بقية النتائج.

Mathematical PageRanks (out of 100) for a simple network (PageRanks reported by Google are rescaled logarithmically). Page C has a higher PageRank than Page E, even though it has fewer links to it; the link it has is of a much higher value. A web surfer who chooses a random link on every page (but with 15% likelihood jumps to a random page on the whole web) is going to be on Page E for 8.1% of the time. (The 15% likelihood of jumping to an arbitrary page corresponds to a damping factor of 85%.) Without damping, all web surfers would eventually end up on Pages A, B, or C, and all other pages would have PageRank zero. Page A is assumed to link to all pages in the web, because it has no outgoing links.

من الطبيعي أن تعتمد النتائج المعادة على مدى إجابة الصفحة عن الاستعلام وهنا تدخل مجموعة من العوامل في الحسبان مثل تكرار الكلمة (Occurrence) في الصفحة وتقنيات استرجاع المعلومات المستخدمة ولكن هذا ليس كل شيء، حيث أن كل صفحة تملك أهمية معينة تساهم في وضعها على رأس قائمة الصفحات المعادة من محرك البحث. يقوم محرك البحث جوجل بإسناد قيمة رقمية لكل صفحة موجودة على الوب تُظهر أهمية هذه الصفحة، وهذا الرقم يدعى ترتيب الصفحة (PageRank) والذي يحدد الترتيب الذي ستَظهر على أساسه نتائج أي استعلام ويتم حسابه بتكامل مجموعة من العوامل أهمها عدد الروابط المشيرة إلى الصفحة (Inbound links) من صفحات أخرى على الوب.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

الخوارزمية

الخوارزمية المبسطة

 
How PageRank Works

Assume a small universe of four web pages: A, B, C and D. The initial approximation of PageRank would be evenly divided between these four documents. Hence, each document would begin with an estimated PageRank of 0.25.


Damping factor

 

So any page's PageRank is derived in large part from the PageRanks of other pages. The damping factor adjusts the derived value downward. The original paper, however, gave the following formula, which has led to some confusion:

 


So, the equation is as follows:

 

where   are the pages under consideration,   is the set of pages that link to  ,   is the number of outbound links on page  , and N is the total number of pages.

The PageRank values are the entries of the dominant eigenvector of the modified adjacency matrix. This makes PageRank a particularly elegant metric: the eigenvector is

 

where R is the solution of the equation

 

where the adjacency function   is 0 if page   does not link to  , and normalized such that, for each j

 ,

i.e. the elements of each column sum up to 1, so the matrix is a stochastic matrix (for more details see the computation section below). Thus the This is a variant of the eigenvector centrality measure used commonly in network analysis.

Because of the large eigengap of the modified adjacency matrix above, [1] the values of the PageRank eigenvector are fast to approximate (only a few iterations are needed).

تنويعات

Google Toolbar

  • كل قيمة أعلى في الـ PageRank يكون الوصول لها أصعب من سابقتها فالوصول إلى PR6 أصعب بأربع مرات من الوصول إلى PR5.
  • إضافتك لصفحات جديدة لموقعك قد يقلل من قيمة صفحات أخرى ولكن هذا التقليل لإعطاء قيمة للصفحة الجديدة.
  • الروابط الداخلية الفعالة في موقعك مهمة.
  • يجب أن تكون صفحات موقعك مترابطة لتسهل على عنكبوت الأرشفة أرشفة جميع الصفحات.
  • من الممكن أن يطرد موقعك من قوقل إذا قمت ببعض العمليات غير المسموح بها مثل النصوص المخفية أو إيهام محرك البحث بعرض محتويات مخصصة له فقط (cloaking) أو أي عملية تخالف أنظمة قوقل.
  • جوجل لايحب الصفحات الممتلئة بالروابط الخارجية خصوصا تلك التي يوجد بها أكثر من 100 رابط.
  • إذا كان هناك أكثر من رابط في نفس الصفحة يؤدون إلى صفحة واحدة فستعتبر هذه الروابط كلها كرابط واحد.
  • الروابط ذات النصوص الجيدة والمرتبطة بمحتوى موقعك ستضمن لك الظهور في نتائج البحث المناسبة.
  • ربما تخسر بعض من قيمة الـ PageRank لموقعك إذا فقدت بعض الروابط المهمة التي تؤدي إلى موقعك أو إذا نقصت قيمة الـ PageRank للصفحات المحتوية على هذه الروابط.
  • الـ PageRank واحد من عوامل عديدة تستخدمها جوجل للتعرف على ترابط وأهمية الصفحات.
  • الـ meta-tag لاتأثر على قيمة الـ PageRank لكن قد يستخدمها قوقل لتوصيف موقعك في نتائج البحث وستكون نافعة إذا كانت صفحات موقعك مليئة بالجرافيكس.
  • الـ PageRank لايتم حسابه للموقع كاملاً بل يتم لكل صفحة على حدى.
  • إذا كانت هناك صفحة سيئة ذات PageRank منخفض بها روابط تشير إلى صفحة أخرى فان هذه الصفحة لا تتأثر بها، لن يعاقبك جوجل لأن هناك صفحات سيئة تربط بك.
  • إذا قمت بإضافة “nofollow” إلى عنصر rel في الرابط فلن يدخل هذا الرابط في حساب الـ PageRank.
  • إذا كان هناك رابط من صفحة إلى نفسها فانه لايؤثر في قيمة الـ.PageRank
  • الـ PageRank يعتمد على الروابط القادمة للصفحة ولكن ليس عليها فقط بل يعتمد على جودتها وترابطها.
  • إذا كان لديك صفحة ولنقل أن قيمة الـ PageRank لها 7 ولم يكن في هذه الصفحة سوى رابط واحد فسيستفيد هذا الرابط بشكل كبير أما ان كان في هذه الصفحة 10 روابط فسيتم توزيع قيمة الـ PageRank بينهم.
  • من الممكن أن يطرد موقعك من قوقل إذا كان يضع روابطا لمواقع مطرودة لذلك تأكد دائما من المواقع التي تريد إضافتها لموقعك صداقة محركات البحث وبالأخص قوقل صاحب الشعبية الأكبر بين مستخدمي الانترنت حول العالم.
  • محرك البحث جوجل يعتبر الرابط من صفحة أ إلى الصفحة ب على أنه تصويت لصالح ب.
  • إضافة موقعك في دليل DMOZ لايعطيك أي أفضلية في حساب الـ PageRank ماتحصل عليه من دليل DMOZ هو نفس مايمكن أن تحصل عليه من أي صفحة أخرى لها نفس القيمة لكن ميزة DMOZ هو أن بياناته تستخدم في الكثير من المواقع الأخرى.
  • محتويات الصفحة لايتم أخذها بالاعتبار عند حساب الـPageRank
  • .gov وغيرها من نطاق(انترنت)النطاقات الحكومية ليس لها أي ميزة خاصة في حساب الـ PageRank ويرجع ارتفاع قيمتها غالبا لأن الروابط المؤدية إليها كثيرة والروابط الخارجة منها لمواقع أخرى قليلة.
  • ارتفاع قيمة الـ PageRank لايعني ارتفاع عرض موقعك

انظر أيضاً

الهامش

  1. ^ Taher Haveliwala and Sepandar Kamvar. (2003). "The Second Eigenvalue of the Google Matrix" (PDF). Stanford University Technical Report. {{cite journal}}: Unknown parameter |month= ignored (help)

المصادر


. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

وصلات خارجية