我正在寻找可定制的PageRank算法的Gremlin版本。有一些旧版本,其中一个(来自:http://www.infoq.com/articles/graph-nosql-neo4j)粘贴在下面。我无法将流程安装到当前基于GremlinGroovyPipeline的结构中。什么是现代化的相当于这个或类似的东西?
$_g := tg:open()
g:load('data/graph-example-2.xml')
$m := g:map()
$_ := g:key('type', 'song')[g:rand-nat()]
repeat 2500
$_ := ./outE[@label='followed_by'][g:rand-nat()]/inV
if count($_) > 0
g:op-value('+',$m,$_[1]/@name, 1.0)
end
if g:rand-real() > 0.85 or count($_) = 0
$_ := g:key('type', 'song')[g:rand-nat()]
end
end
g:sort($m,'value',true())
http://www.slideshare.net/slidarko/gremlin-a-graphbased-programming-language-3876581的幻灯片55上提供了另一个版本。使用if语句并根据它们更改遍历的能力对于自定义很有价值。
非常感谢答案 0 :(得分:1)
我想我会自己回答,以防其他人需要它。请注意,这不是一个非常有效的PageRank计算。它应该只被视为一个学习的例子。
g = new TinkerGraph()
g.loadGraphML('graph-example-2.xml')
m = [:]
g.V('type','song').sideEffect{m[it.name] = 0}
// pick a random song node that has 'followed_by' edge
def randnode(g) {
return(g.V('type','song').filter{it.outE('followed_by').hasNext()}.shuffle[0].next())
}
v = randnode(g)
for(i in 0..2500) {
v = v.outE('followed_by').shuffle[0].inV
v = v.hasNext()?v.next():null
if (v != null) {
m[v.name] += 1
}
if ((Math.random() > 0.85) || (v == null)) {
v = randnode(g)
}
}
msum = m.values().sum()
m.each{k,v -> m[k] = v / msum}
println "top 10 songs: (normalized PageRank)"
m.sort {-it.value }[0..10]
这是一个简化的单行的好参考: https://groups.google.com/forum/m/#!msg/gremlin-users/CRIlDpmBT7g/-tRgszCTOKwJ (以及Gremlin wiki:https://github.com/tinkerpop/gremlin/wiki)