如果我想计算指向自身和悬空节点的节点的PageRank值,我会丢弃悬空节点,初始(和最终)PageRank将为1?
答案 0 :(得分:1)
原始页面排名算法不允许自循环。但是,有一些变体要么显式添加自循环,要么考虑链接结构中存在的自循环。
所以这里我们有完整的Web(或我们抓取的网页)只包含两个节点。 A有一个自循环和另一个到B.的链接.B没有链接。这导致最终PR向量中的0值。 MMDS书(Ullman)建议了几个选项:(1)递归递降,或(2)添加税收参数。 在您的示例中,我们可以删除第二个节点。见图ii。现在我们只剩下一个带自循环的节点。请记住,已删除的节点尚未获得0分。如果,让我们说,你的实现假定一个自循环被计为一个inlink,现在A的PR得分为1.B有一个继承者(A),这将有助于它。 A有两个外链(循环假设,加上B的链接)。见图iii。所以最后我们得到B的公关为0.5
请注意,PageRank的总和超过1,它们不再代表随机冲浪者的分布。然而,它们确实代表了对页面相对重要性的不错估计。 * Ullman MMDS,第172-173页,第9-10页,pdf。