Question

鉴于以下示例数据，我想构建一个Gremlin查询，该查询返回Alice的ruby连接网络，深层次为3级：

Vertex: Alice
Vertex: Bobby
Vertex: Cindy
Vertex: David
Vertex: Eliza

Edge: [Alice] -> [Rates(tag:ruby,value:0.9)] -> [Bobby]
Edge: [Bobby] -> [Rates(tag:ruby,value:0.8)] -> [Cindy]
Edge: [Cindy] -> [Rates(tag:ruby,value:0.7)] -> [David]
Edge: [David] -> [Rates(tag:ruby,value:0.6)] -> [Eliza]   # ignored, level 4
Edge: [Alice] -> [Rates(tag:java,value:0.9)] -> [Eliza]   # ignored, not ruby

所以返回的数据应该是这样的：

Bobby: [0.9]
Cindy: [0.9, 0.8]
David: [0.9, 0.8, 0.7]

返回每个顶点ID，以及评级值路径的数组。

我正在使用当前版本的JanusGraph（Gremlin 3）。我对Gremlin很新;我一直在困惑一些与我想要的查询有共同点的食谱，但我仍然没有看到如何到达那里......

非常感谢您提供的任何帮助或建议。

Answer 1

当询问Gremlin问题时，如果您提供一个可以轻松剪切并粘贴到Gremlin控制台的示例图表，那么对于那些试图回答的人总是有帮助：

graph = TinkerGraph.open()
g = graph.traversal()
g.addV().property('name','alice').as('a').
  addV().property('name','bobby').as('b').
  addV().property('name','cindy').as('c').
  addV().property('name','david').as('d').
  addV().property('name','eliza').as('e').
  addE('rates').property('tag','ruby').property('value',0.9).from('a').to('b').
  addE('rates').property('tag','ruby').property('value',0.8).from('b').to('c').
  addE('rates').property('tag','ruby').property('value',0.7).from('c').to('d').
  addE('rates').property('tag','ruby').property('value',0.6).from('d').to('e').
  addE('rates').property('tag','java').property('value',0.9).from('a').to('e').iterate()

使用此图表，我想出了这种方法来获得您想要的结果：

gremlin> g.V().has('name','alice').
......1>   repeat(outE().has('tag','ruby').inV()).
......2>     times(3).
......3>     emit().
......4>   group().
......5>     by('name').
......6>     by(path().
......7>        unfold().
......8>        has('value').
......9>        values('value').
.....10>        fold())
==>[bobby:[0.9],cindy:[0.9,0.8],david:[0.9,0.8,0.7]]

使用emit()跟进第3行可能是非常明显的 - 找到＆＃34; alice＆＃34;然后反复遍历out()到3的深度并发射沿途发现的每个顶点。这可以让你得到你关心的顶点：

gremlin> g.V().has('name','alice').
......1>   repeat(outE().has('tag','ruby').inV()).
......2>     times(3).
......3>     emit()
==>v[2]
==>v[4]
==>v[6]

更复杂的部分出现在此之后，您担心检索每个部分的路径信息，以便您可以获取＆＃34;值＆＃34;每个＆＃34;费率＆＃34;边缘。我选择使用group，以便轻松获得您想要的Map结构。显然，如果＆＃34; bobby＆＃34;在树中出现两次，你最终得到了Map条目的两个评级列表。

如果您选择group()中发生的事情，您可以看到它由两个by()选项调制。第一个对应于Map中的密钥（显然，我假设＆＃34; name＆＃34;的唯一性）。第二个从当前遍历器（人员顶点）中提取路径。在进一步研究之前，只需查看path()：

的输出结果

gremlin> g.V().has('name','alice').
......1>   repeat(outE().has('tag','ruby').inV()).
......2>     times(3).
......3>     emit().
......4>   group().
......5>     by('name').
......6>     by(path()).next()
==>bobby=[v[0], e[10][0-rates->2], v[2]]
==>cindy=[v[0], e[10][0-rates->2], v[2], e[11][2-rates->4], v[4]]
==>david=[v[0], e[10][0-rates->2], v[2], e[11][2-rates->4], v[4], e[12][4-rates->6], v[6]]

以下步骤path()将该路径操作为您想要的表单。它展开每条路径，然后通过查找＆＃34; value＆＃34;的边缘属性来过滤掉边缘。然后提取它，然后将值折回到地图中每个值的列表中。

Gremlin查询以基于边缘属性递归获取节点

1 个答案: