此算法被用作googlePR算法的一部分

假设一个概率q:为用户进入一个随机抽取的网页的概率 (取值为0.15)

1-q: 为用户进入当前网页后点当前网页超链接的概率

进一步假设用户不回溯先前访问的网页,这个过程可以通过构造马尔可夫链来实现。于是每个访问的网页的概率就可以算出来。

设C(a)为a网页包含的超链接数量,也就是outing link .

设p1  到pn  为指向网页a的网页标识 。

于是网页a的PR值为:

PR(a)=q+ (1-q){ 西格玛i从1到n [PR(Pi)/C(Pi)] }

通过公式可以看出C(Pi)的值是已知的,也就是说前人已经算好了 。  

网页的PR值作用是:Crawling可以根据网页的PR值去抓优质的网页。

所以可以看出网页设计者应该设计描述性强的网页标题,头信息,原数据,和好的超链接。

这是我翻译的一篇文献的一部分,希望能给大家提供一些帮助。