neo4j:返回最长匹配补丁上的所有节点

时间:2013-10-01 00:37:06

标签: python neo4j cypher py2neo

使用neo4j 1.9.4和py2neo 1.6,我的图中有一个类似二叉树的结构,每个节点最多有两个子节点。但是,图表并不完整,所以它可能看起来像这样,“(x)”表示节点,“[y]”表示关系。

                     (root)
                     /     \
                   [0]     [1]
                   /         \
                 (0)         (1)
                /   \          \
              [0]   [1]        [1]
              /       \          \
            (00)      (01)       (11)
            /
          [0]
          /
       (000)

我在这里编写了一些类似的例子:http://console.neo4j.org/r/ni6t5b(如果由于某种原因它不起作用,你可以使用以下命令创建图形:

CREATE (node1 { name: '1' }),(node2 { name: '11' }),(node3 { name: '10' }),(node4 { name: '0' }),(node5 { name: '01' }),(node6 { name: '00' }),(node7 { name: '10' }),(root { name:'root' }), root-[:`1`]->node1, node1-[:`1`]->node2, node1-[:`0`]->node7, node2-[:`0`]->node3, root-[:`0`]->node4, node4-[:`1`]->node5, node4-[:`0`]->node6

我想返回(单个)特定路径上存在的所有节点。

START root=node(1) 
MATCH path = root-[?:`0`]-()-[?:`0`]-()-[?:`0`]-() 
RETURN NODES(path)

(注意:让ID(root)= 1)这将返回路径中的所有节点,即(0),(00)和(000) 但是,由于我不知道每个分支的深度,我还想查询这样的内容:

START root=node(1) 
MATCH path = root-[?:`1`]-()-[?:`1`]-()-[?:`0`]-()-[?:`0`]-() 
RETURN NODES(path)

应该返回最长路径上的所有节点,即(1)和(11)。实际上,此查询不返回任何内容。我怎样才能做到这一点?注意:对于每个路径,我事先都不知道,此路径是否具有现有的结束节点。我只想返回该路径上存在的所有节点。

此外,最好的方法是使用py2neo(python)自动构建这样的查询。例如,我有一个列表,其中包含我需要查询其中每个路径的几个路径。每个路径只是在'0'和'1'之间存在?

list_of_paths = ["0010", "101", "11", "101110"]

谢谢你们,伙计们!

编辑:在这里(http://wes.skeweredrook.com/cypher-longest-path/)我可以找到类似的问题。但是,关系类型始终是相同的,这不适用于我的场景。所以我想我不能从那里采用这个解决方案。

EDIT2: Wes的建议解决了我的问题:

START root=node(1)
MATCH path=root-[:`1`|`0`*]->leaf
RETURN path

此查询返回从根节点开始的所有可能路径。我想要的是一个特定路径的节点。

EDIT3: Wes的更新建议也解决了我的问题。它只返回整个图形中最长的现有路径。但我想查询特定的路径并将所有节点返回到图形中不再存在路径的点。所以我可能想要查询一个非常长的路径,但事实上路径已经停在第一个节点,例如root - [1] - >() - [0] - >() - ...此查询应仅在路径停止时返回node(1)。 (节点(1)没有类型0)的传出关系

EDIT4:我试图找出一个有效的解决方案,但它很脏。

tree_root, = graph_db.create({"name": "root"}) # create a root

node_list = []
my_path = [1, 1, 0, 1, 1, 1] # path to query
len_of_path = len(my_path)

# add the corresponding number of nodes to the list and name them n0,..nX
for i in range(0,len_of_path):
    node_list.append("n"+str(i))


# construct the query string
my_query_start = 'START root=node({root_id}) MATCH (root)'
my_query_return = ' RETURN'

for i in range(0, len(node_list)):
    my_query_start += '-[?:`' + str(my_path[i]) + '`]->(' + str(node_list[i]) + ')'
    if i == len(node_list)-1:
        my_query_return += ' ' + str(node_list[i])
    else:
        my_query_return += ' ' + str(node_list[i]) + ','

# concatenate the query
complete_query = my_query_start + my_query_return
#print "complete_query:", complete_query

# execute the query
query_paths = neo4j.CypherQuery(graph_db, complete_query)
params = {"root_id" : tree_root._id}
my_list_of_nodes = query_paths.execute(**params)

#output results
print "data of my_list_of_nodes:", my_list_of_nodes.data
print "columns of my_list_of_nodes:", my_list_of_nodes.columns

请大家,不要告诉我这应该是最终解决方案; - )

1 个答案:

答案 0 :(得分:2)

您是否可以使用带有OR的可变长度路径作为reltype?

MATCH path=root-***put your partial pattern here***->[:`1`|`0`*]->leaf
WHERE NOT (leaf)-[:`0`|`1`]->()
RETURN path
ORDER BY length(path) DESC
LIMIT 1

我认为它解决了你的例子...但是它比这更复杂吗?