我一直在努力让我了解个性化网页排名算法及其工作原理。我遇到了this paper,它给出了这张图:see link to image below,其权重由PPR计算。我无法用他们提供的模型重现计算。
任何人都可以帮我分解这个概念吗?
谢谢!
答案 0 :(得分:0)
本文是个性化页面排名的一个很好的参考。基本上我的理解是,ppr分数告诉你从源节点移动到目标节点的概率。它是描述图中特定源节点和目标节点之间关系的特定分数。
如果重现结果有问题,可以在python中使用networkx,加载图形并使用ppr计算ppr networkx.pagerank(graph,personalization = {' a':0,'':1,' b':0 ....}) Networkx使用功率迭代方法来计算ppr,您可以获得与示例中所示的精确结果。
本论文的作者在此处使用c ++代码https://github.com/snap-stanford/snap/blob/master/snap-core/randwalk.h由于此方法是基于随机游走的方法,因此您无法获得与示例中显示的完全相同的结果,但排名是正确的。
希望有所帮助。