检查网页排名收敛

时间:2016-12-09 20:55:27

标签: hadoop apache-spark pagerank

我已经以下面的方式实现了页面排名收敛, 总结所有页面的所有页面排名分数并与之前的迭代进行比较。我的一位朋友给了我以下解释: “如果你看一下pagerank论文,他们说他们的实现将导致所有分数​​总和为1,并且这些总和不会在多次迭代中改变。 这是来自论文:“请注意,PageRanks形成了网页上的概率分布,因此所有网页的PageRanks总和将是一个”

找到页面排名算法是否收敛的正确方法是什么?请注意我在Hadoop中实现页面排名以及spark。请建议,我很困惑。

1 个答案:

答案 0 :(得分:0)

您可以像在任何迭代算法中那样定义收敛。如果迭代之间的估计参数的变化低于收敛的阈值算法。