如何在数据集上运行Blazegraph中的PageRank?

时间:2015-06-15 10:42:58

标签: parallel-processing bigdata gpgpu pagerank blazegraph

我想在Blazegraph中运行从 SNAP 下载的数据集中的PageRank算法,斯坦福网络分析项目。据我所知,Blazegraph中有一个PageRank实现,但我找不到运行它的方法。可以运行它吗?如果是,怎么样?

1 个答案:

答案 0 :(得分:2)

您可以使用Blazegraph GAS API对Blazegraph中加载的数据执行图表分析。下面的示例显示了在命名空间中加载的所有数据上运行PageRank。如果您将特定的SNAP数据集转换为RDF,您可以随时发布链接。

PREFIX gas: <http://www.bigdata.com/rdf/gas#>
SELECT ?node ?rank {
  SERVICE gas:service {
     gas:program gas:gasClass "com.bigdata.rdf.graph.analytics.PR" .
     gas:program gas:out ?node . # exactly once - will be bound to the visited vertices.
     gas:program gas:out1 ?rank . # Computed PageRank value for the node
  }
  FILTER (?rank<100)
} ORDER BY DESC(?rank) 

通过自治系统(AS)链接连接的PageRank示例输出:

node    rank
<as:1120>   0.4546700227713777
<as:11492>  0.42358562655858023
<as:12644>  0.41794183515852634
<as:12143>  0.39695587975476715
<as:10217>  0.37759985273202806
<as:13092>  0.3668006144247455
<as:11139>  0.33221277719235737
<as:12722>  0.3256365110406788
<as:10913>  0.32270313230429504