根据从不同边缘的属性派生的信息过滤边

时间:2017-11-02 10:24:06

标签: gremlin tinkerpop3

我尝试使用Tinkerpop3将列车时刻表表示为图表。图表的节点是火车站,边缘是"调度元素"包含从一个车站到另一个车站的火车的所有信息。我目前正在努力制定一个图表查询,以找到与火车相对应的所有边缘,这些边缘在一个时间窗口内离开一个站​​点,该时间窗口来自不同边缘的属性。

为了说明我试图解决的问题,我设置了一个小玩具图:

graph = TinkerGraph.open()

g = graph.traversal()

g.addV().property('name', 'London Euston').
  addV().property('name', 'Milton Keynes').
  addV().property('name', 'Stoke-on-Trent').
  addV().property('name', 'Stockport').
  addV().property('name', 'Manchester Piccadilly')

  schedule = [['London Euston', 'Milton Keynes', 
               'T1', 1509537600000, 1509539400000],
              ['Milton Keynes', 'Stoke-on-Trent', 
               'T1', 1509539460000, 1509541200000],
              ['Stoke-on-Trent', 'Stockport', 
               'T1', 1509541260000, 1509543000000],
              ['Stockport', 'Manchester Piccadilly', 
               'T1', 1509543060000, 1509544800000],
              ['London Euston', 'Milton Keynes', 
               'T2', 1509537900000, 1509540000000],
              ['Milton Keynes', 'Stoke-on-Trent', 
               'T2', 1509540060000, 1509542100000],
              ['Stoke-on-Trent', 'Stockport', 
               'T2', 1509542160000, 1509544200000],
              ['Stockport', 'Manchester Piccadilly', 
               'T2', 1509544260000, 1509546600000],
              ['London Euston', 'Milton Keynes', 
               'T3', 1509548400000, 1509550200000],
              ['Milton Keynes', 'Stoke-on-Trent', 
               'T3', 1509550260000, 1509552000000],
              ['Stoke-on-Trent', 'Stockport', 
               'T3', 1509552060000, 1509553800000],
              ['Stockport', 'Manchester Piccadilly', 
               'T3', 1509553860000, 1509555600000]]

for(scheduleInfo in schedule)
{
  v1 = g.V().has('name', scheduleInfo[0]).next()
  v2 = g.V().has('name', scheduleInfo[1]).next()

  v1.addEdge('Schedule', v2, 
             'trainID', scheduleInfo[2], 
             'outTime', scheduleInfo[3], 
             'inTime', scheduleInfo[4])
}

该图表包括从伦敦到曼彻斯特的三列火车的(组成)时间表。边缘有三个属性:

  • trainID:火车ID
  • outTime:离开传出节点的出发时间
  • inTime:传入节点的到达时间

所有时间都以UNIX时间戳存储,以毫秒为单位。我想从图表中找到的一件事是:

用于训练' T1'离开,其他列车还离开那些车站?

这是一个相当容易的Gremlin查询

g.E().has('trainID','T1').as('e1').
outV().as('station').outE().as('e2').
path().by('trainID').by('name')

我现在正在努力解决的问题是以下内容:

用于训练' T1'离开,有多少列车在火车的正负15分钟内离开同一车站' T1'?

到目前为止,我能够提出的最接近的答案是:

g.E().has('trainID','T1').as('e1').
outV().as('station').
outE().as('e2').
path().
filter{it.get().e2.outTime > (it.get().e1.outTime - 60*15*1000L)}.
filter{it.get().e2.outTime < (it.get().e1.outTime + 60*15*1000L)}

这个查询获取了我想要的所有路径,但它使用了lambda步骤,这是TinkerPop3文档明确不鼓励的。我想知道是否有一种不同的方式来编写这个不使用lambda步骤的查询。任何帮助将不胜感激。

1 个答案:

答案 0 :(得分:2)

基本查询是:

g.E().has('trainID','T1').
  sack(assign).
    by('outTime').
  outV().as('station').
  outE().has('trainID', neq('T1')).
  sack(minus).
    by('outTime').
  filter(sack().is(between(-60*15*1000L, 60*15*1000L)))

添加一些路径标签以创建更易读的输出:

gremlin> g.E().has('trainID','T1').as('e1').
           sack(assign).
             by('outTime').
           outV().as('station').
           outE().has('trainID', neq('T1')).as('e2').
           sack(minus).
             by('outTime').
           filter(sack().is(between(-60*15*1000L, 60*15*1000L))).
           select('station','e1','e2').each {
             println "${it.get('station').value('name')}"
             println "* T1 departure: ${new Date(it.get('e1').value('outTime'))}"
             println "* ${it.get('e2').value('trainID')} departure: ${new Date(it.get('e2').value('outTime'))}\n"
           }; []
London Euston
* T1 departure: Wed Nov 01 05:00:00 MST 2017
* T2 departure: Wed Nov 01 05:05:00 MST 2017

Milton Keynes
* T1 departure: Wed Nov 01 05:31:00 MST 2017
* T2 departure: Wed Nov 01 05:41:00 MST 2017

Stoke-on-Trent
* T1 departure: Wed Nov 01 06:01:00 MST 2017
* T2 departure: Wed Nov 01 06:16:00 MST 2017