Pagerank个性化矢量,边缘权重和悬空字典(隐形传送矢量)

时间:2016-03-24 19:05:54

标签: python twitter data-mining networkx pagerank

这是来自networkx的pagerank函数

def pagerank(G, alpha=0.85, personalization=None,
             max_iter=100, tol=1.0e-6, nstart=None, weight='weight',
             dangling=None):

我对个性化和体重感到困惑。

我理解当个性化矩阵没有提供时,使用了均匀的矩阵,当没有提供权重时,使用边缘权重为1。

我一直在阅读:边缘权重个性化和节点权重个性化。

http://www.cs.cornell.edu/~bindel/present/2015-08-kdd-talk_kdd-aug15.pdf

所以我的假设是个性化矢量 - >可用于节点权重个性化。例如。我们正在计算特定主题t的节点的pagerank。我们给出个性化向量,其中与主题更相关的节点获得更多价值。

但边缘重量呢?当我从V向一个输出边缘赋予更高的权重时,会发生什么呢? ?

我无法将这两件事分开(边缘权重和个性化矢量)。

还有: 悬挂的字典:代表传送矢量。如果没有提供个性化矢量。悬空字典对我来说更容易理解,它提供了当我们到达悬空节点时随机转换的概率。

有人可以帮助理解我提供这三种情况的情况,即边缘权重,个性化向量和悬空向量(如何影响页面效果)

1 个答案:

答案 0 :(得分:0)

这不是一个真正的编程问题,但无论如何我都会回答。

在NetworkX实现中,如果您设置个性化向量,这些值也将用于"悬空节点" - 您无法单独设置悬空节点值。

'权重='参数给出edge属性用作数字边权重。默认值为weight = None将所有权重设置为相等(为1)。如果您想偏置某些边缘,可以根据图表中的属性随意调整它们。