端点SEO博客

系统化学习SEO技术,实时关注业界动态

Google PageRank算法

PRPageRank的缩写。Google PR理论是所有基于链接的搜索引擎理论中最著名的。PR是Google创始人之一拉里佩奇发明的,用于表示页面重要性的概念。用最简单的话说就是,反向链接越多的页面就是最越重要的页面,因此PR值也越高。

PR的概念和计算,我们可以把互联网理解为由节点及链接组成的有向图,页面就是一个个节点,页面之间的有向链接传递着页面的重要性。一个链接传递的PR值决定于导入链接所在页面的PR值,发出链接的页面本身PR值越高,所能传递出去的PR也越高。传递的PR数值也取决于页面上的导出链接数目。对于给定PR值的页面来说,假设能传递到下级页面100份PR,页面上有10个导出链接,每个链接能传递10份PR,页面上有20个导出链接的话,每个链接只能传递5份PR。所以一个页面的PR值取决于导入链接总数,发出链接页面的PR值,以及发出链接页面上的导出链接数目。
PR值计算公式是:
PR(A) = (1-d) + d(PR(t1)/C(t1) + 、、、 + PR(tn)/C(tn))
A代表页面A
PR(A)则代表页面A的PR值
d为阻尼指数。通常认为d=0、85
t1、、、tn代表链接向页面A的页面t1到tn
C代表页面上的导出链接数目。C(t1)即为页面t1上的导出链接数目。

从概念及计算公式都可以看到,计算PR值必须使用迭代计算。页面A的PR值取决于链接向A的页面t1至tn页面的PR值,而t1至tn页面的PR值又取决于其他页面的PR值,其中很可能还包含页面A。所以PR需要多次迭代才能得到。计算时先给所有页面设定一个初始值,经过一定次数的迭代计算后,各个页面的PR值将趋于稳定。研究证明,无论初始值怎么选取,经过迭代计算的最终PR值不会受到影响。

pagerank算法

对阻尼系数做个简要说明。如上图所示考虑一个循环(实际网络上是一定存在这种循环的):外部页面Y向循环注入PR值,循环中的页面不停迭代传递PR,没有阻尼系数的话,循环中的页面PR将达到无穷大。引入阻尼系数,使PR在传递时自然衰减,才能将PR计算稳定在一个值上。

PR值只与链接有关。有反向链接就有PR,没有反向链接就没有PR。一个高质量的原创网站,一般来说自然会吸引到比较多的外部链接,所以会间接提高PR值,但这并不是必然的。

除非注明,文章均由©端点SEO博客原创
转载请保留本文链接:http://www.iseoduan.com/searchengine/154.html
最后更新: 2016年11月24日 — 23:32
©2015~2017 | 端点SEO博客:揭露SEO本质,提供SEO培训,系统的学习SEO优化 备案号:京ICP备12011610号-3 站点地图|端点SEO博客