理解PageRank和类似算法背后的数学

时间:2010-10-01 18:00:58

标签: algorithm math pagerank

我查看了本网站提出的类似问题所提供的大量资源,此讨论中找到了迄今为​​止最有帮助的资源,以及此处链接的资源:PageRank Explained.

虽然这提供了详细的概述,但我正在寻找更具体的东西。虽然我意识到还有其他因素在起作用,并且算法一开始就有多处变化,但是从每个链接传递的值的一个很好的指示是:PageRank除以链接的总页数。因此,如果一个站点(页面)的PR为8,并链接到20个站点,则传递给每个站点的总值为8/20。这是我所相信的。我知道PageRank在对数刻度上是1到10之间的值,这意味着从PR 1到2变得比PR 9变为10要困难得多。这里我很困惑 - 如何计算金额PR转移到每个链接。我非常简化,因为带有大约10个出站链接的PR 10的页面仍然应该比具有2个出站链接的PR 5站点传递更多的值。在一个简单的层面上理解这背后的正确数学的最佳方法是什么?

1 个答案:

答案 0 :(得分:1)

首先,值得注意的是,目前实施的PageRank与论文中的原始想法有很大不同,并且随着它的变化,即使SO问题中的其他信息也不完全可靠。但我认为基本面是相似的。

我认为PageRank在转换为对数刻度之前是分开的,所以如果你的PageRank为P且n> 0个出站链接,转移的PR将(由于衰减因子而略低于)P-log_10 n。因此,使用10个链接,PR将减少1,100个链接减少2,依此类推。当然,如果n为0,那么没有PageRank被赋予其他页面,它只是浪费了。