这个Neo4j查询可以优化吗?

时间:2017-09-11 09:12:34

标签: performance neo4j cypher

我有相当大的数据集(20毫升节点,200毫升边缘),最简单的 shortestPath 查询以毫秒结束,一切都很棒。

但是......我需要允许 shortestPath 具有类型999的ZERO或ONE关系,它只能是起始节点的第一个。

所以,我的查询变成了这样:

MATCH (one:Obj{oid:'startID'})-[r1*0..1]-(b:Obj) 
WHERE all(rel in r1 where rel.val = 999) 
WITH one, b 
MATCH (two:Obj{oid:'endID'}), path=shortestPath((one) -[0..21]-(two)) 
WHERE ALL (x IN RELATIONSHIPS(path) 
WHERE (x.val > -1 and x.val<101) or (x.val=999 or x.val=998)) return path

它在短路径(最多2-4)的情况下以毫秒运行,但对于像5 ++这样的路径可能需要5或20秒。也许我组成了低效的查询?

这个问题将在可用时得到解决。

1 个答案:

答案 0 :(得分:1)

我的一些要求对我来说有点不清楚,所以我会重申我的理解并提供解决方案。

您想要检查起始节点和结束节点之间的最短路径。

返回的路径应该是ZERO或ONE关系,val值为999.如果它与该值有一个关系,那么它应该是第一个。

这是基于该逻辑的尝试:

 MATCH (start:Obj {oid:'startID'}),
       (end:Obj {oid:'endID'}),
       path=shortestPath((start)-[1..21]->(end))
  WITH path, relationships(path) AS rels
 WHERE all(r IN relationships WHERE r.val != 999)
    OR (relationships[0].val = 999
        AND all(r IN relationships[1..] WHERE r.val != 999))
RETURN path

我没有机会对实际数据进行测试,但希望这种逻辑和方法至少指向正确的方向。

另请注意:最终的整个WHERE子句可能会缩减为:

 WHERE all(r IN relationships[1..] WHERE r.val != 999)

意思是你甚至不需要检查第一个关系。