رازهاى Google Page Rank

رازهاى Google Page Rank

در يك بررسى دقيقتر Page Rank متشكل از يك جدول توزيع احتمال است كه ميزان شانس كليك هاى احتمالى به صورت تصادفى از صفحات مختلف به مقصد يك صفحه فرضى را به نمايش مى گذارد كه براى صفحه اى با هر اندازه دلخواه قابل محاسبه است. به طور كلى در اكثر تحقيقات علمى براى شروع عمل محاسبه رتبه سايت با توجه به تعداد سايت هاى مورد بررسى احتمال اوليه بين آنها تقسيم ميشود (مثلا اگر در حال بررسى 5 سايت متفاوت هستيم در ابتدا براى هركدام شانس 20 درصد را در نظر مى گيريم). در عمل Page Rank براى انجام پروسه خود به عملى به نام تكرار (iterations) احتياج دارد كه منظور از آن عمل گشتن در ميان لينك هاى مختلف از سايت هاى متفاوت است (از يك سايت شروع و همينطور لينكها را دنبال مى كند). كه در اينجا عددى مابين صفر و يك را به هرصفحه نسبت مى دهد مثلا يك صفحه با0‎/5 Rank يعنى احتمال اينكه شخصى با فشردن يك لينك به طور تصادفى به اين قسمت هدايت شود 50 درصد مى باشد. با يك مثال وضعيت پيچيده بالا را كمى روشن مى كنيم: فرض كنيد در حال بررسى چهار صفحه A،B،C و D هستيم. طبق آنچه كه در بالا تشريح كرديم در ابتدا براى هركدام شانس مساوى و برابر 0‎/25 را در نظر مى گيريم. حالا فرض كنيد كه هر سه صفحه B،C و D هركدام به تنهايى به صفحه A لينك داده اند به همين خاطر Rank صفحه A برابر حاصل جمع Rank صفحات B،C وD ميباشد كه مى شود 0‎/.75 اگر در اين لحظه فرض كنيم كه صفحه B علاوه بر A به صفحه C نيز لينك داده است و همچنين صفحه D نيز به همه سه صفحه ديگر لينك داده است آنوقت ارزش رأى صفحه اى كه به چندين صفحه لينك داده است به تعداد لينك هايش تقسيم مى شود. محاسبه Page Rank به همراه ضريب تعديل Damping Factor) ): مكانيزم عملكرد Page Rank در نظر مى گيرد كه حتى يك User موهومى (كه مى تواند يك روبات مخصوص كليك كردن باشد) هم در نهايت به كليك كردن خود پايان مى دهد به همين خاطر و براى دقيق تر كردن رتبه بندى خود، Page Rank فاكتورى به نام فاكتور تصحيح يا d را معرفى مى كند كه عبارت است از احتمال اينكه User (در هر مرحله اى كه باشد) به عمل كليك كردن خود ادامه دهد. اين فاكتور تاكنون از روش هاى متفاوتى محاسبه شده است ولى در عمل براى آن مقدارى در حدود 0‎/85 را در نظر مى گيرند كه در محاسبه رتبه سايت اين فاكتور را از عدد يك كسر كرده و حاصل را با حاصل ضرب فاكتور تصحيح و Rank قبلى، جمع مى نمايند . بدين صورت رتبه هر صفحه به طور گسترده اى وابسته به رتبه صفحات ديگرى كه به آن لينك داده اند مى باشد. گوگل هرگاه كه اقدام به Update كردن خود مى نمايد اين Rank ها نيز به روز مى شوند و البته با افزايش صفحات موجود در آرشيو گوگل رتبه ابتدايى براى صفحات نيز خود بخود كاهش مى يابد (چون بين تعداد بيشترى تقسيم مى شود) براى Update شدن اين Rank ها گوگل به صورت تصادفى از يك URL (آدرس اينترنتى) آغازكرده و با دنبال كردن لينكهاى موجود در آن صفحه به صفحات و صفحات ديگر مى رود و اين روند را دنبال مى كند حالا اگر در اين ميان به صفحه اى بر بخورد كه در آن هيچ لينكى موجود نباشد(Sink) آنوقت تكليف چيست ؟ پاسخ راحت است در آن لحظه يك URL ديگر به طور تصادفى اتنخاب مى گردد. به طور حتم Google Page Rank يكى از چندين راه شناساندن صفحات مهم به جستجوگر Google مى باشد كه ارزش آن تا به جايى رسيده است كه بسيارى از وب سايت ها براى گذاشته شدن لينك صفحه شان در سايتهاى معروف مبالغ هنگفتى را پرداخت مى كنند كه البته اين نيز از ديد گوگل پنهان نمانده است و به آنها اخطار كرده كه در صورت محرز شدن اين امر آن لينك ها را ناديده مى گيرد.
writeage.com

 

All rights reserved-Designed By  silkfly.ir