GraphX Pagerank实现

时间:2016-03-15 21:19:23

标签: scala apache-spark pagerank spark-graphx

所以我对GraphX pagerank实现感到有些困惑。

https://github.com/apache/spark/blob/feaa07802203b79f454454445c0a12a2784ccfeb/graphx/src/main/scala/org/apache/spark/graphx/lib/PageRank.scala#L115-L160

特别是第138行,https://github.com/apache/spark/blob/feaa07802203b79f454454445c0a12a2784ccfeb/graphx/src/main/scala/org/apache/spark/graphx/lib/PageRank.scala#L138

为什么不将顶点的页面排名定义为 OnModelCreating 代替 resetProb + (1.0 - resetProb) * msgSum

任何人都能解释这种差异吗?链接也不指向高手,对不起,如果有人对此感到困惑,那么,master仍然有相同的代码。

1 个答案:

答案 0 :(得分:0)

这样做有什么意义?

resetProb + (1.0 - resetProb) * msgSum

resetProb在算法执行期间不会更改(默认情况下为0.15)。所以这只是一个常数。为什么你认为为每个顶点的页面排名添加常量是有意义的。