PageRank让链接来“投票” (二)

信息来源:赢时代  作者:何志忠  阅读次数: 次  发布时间:2007-07-11
文章摘要:这个方程式引入了随机浏览的概念,即有人上网无聊随机打开一些页面,点一些链接。一个页面的PageRank值也影响了它被随机浏览的概率。为了便于理解,这里假设上网者不断点网页上的链接,最终到了一个没有任何链出页面的网页,这时候上网者会随机到另外的网页开始浏览。

上一章"PageRank让链接来"投票" (一)"提到了PageRank 的技术及简单算法,本章再深入的探讨一下PageRank完整的算法。

完整的算法

这个方程式引入了随机浏览的概念,即有人上网无聊随机打开一些页面,点一些链接。一个页面的PageRank值也影响了它被随机浏览的概率。为了便于理解,这里假设上网者不断点网页上的链接,最终到了一个没有任何链出页面的网页,这时候上网者会随机到另外的网页开始浏览。

为了对那些有链出的页面公平,q = 0.15(q的意义见上文)的算法被用到了所有页面上, 估算页面可能被上网者放入书签的概率。

所以,这个等式如下:

p1,p2,...,pN是被研究的页面,M(pi)是链入pi页面的数量,L(pj)pj链出页面的数量,而N是所有页面的数量。

PageRank值是一个特殊矩阵中的特征向量。这个特征向量为

R是等式的答案

如果pj不链向pi, 而且对每个j都成立时,等于 0

这项技术主要的弊端是,旧的页面等级会比新页面高,因为新页面,即使是非常好的页面,也不会有很多链接,除非他是一个站点的子站点。

这就是 PageRank 需要多项算法结合的原因。昨天点石互动也说了wikipedia.com在google的一些关键词内表现很好整体的访问量超过一些门户网站,另一方面也是数万网民的共同努力。

Google对维基百科情有独钟之一,风采依扬想应该是:PageRank 似乎倾向于维基百科页面,在条目名称的搜索结果中总在大多数或者其他所有页面之前。原因主要是维基百科内相互的链接很多,并且有很多站点链入。

Google 经常处罚恶意提高 PageRank 的行为。Google 究竟怎样区分正常的链接交换和不正常的链接堆积仍然是商业机密。


作者:风采依扬
原载:SEO服务
版权所有,转载请以链接形式注明作者及原始出处。
热点链接:  PageRank  链接  
参与评论
用户名:新注册) 密码:匿名评论
说明:不能超过250字,需审核后才会发布,请自觉遵守互联网相关政策法规.