使用neo4j找到与给定节点有关系的节点集的有效方法

时间:2010-06-02 08:21:30

标签: java graph set neo4j

给定两个节点是否有一种有效的方法来查找一组公共节点(具有已定义的关系)。

例如,让节点A1B1C1 - C4与关系xy相关联:

A1 --x--> C1
A1 --x--> C2
A1 --x--> C3
B1 --y--> C2
B1 --y--> C3
B1 --y--> C4

A1(x)B1(y)的公共节点集将为[C2, C3]

2 个答案:

答案 0 :(得分:8)

在Gremlin(http://gremlin.tinkerpop.com)中,这表达如下:

setA._().out('x').in('y').retain(setB).back(2)

以下是每个步骤的作用:

  1. 从setA开始(在您的示例中为A1,A2,A3)。
  2. 启动Gremlin管道。
  3. 将那些setA顶点的输出“x”标记边缘取为C1,C2和C3。
  4. 从C1,C2和C3中取出传入的“y”标记边。
  5. 过滤掉所有不在setB中的步骤(因此,只存在C2和C3路径)。
  6. 回到2步之前看到的 - 因此,C2和C3。
  7. 多田!

    祝你好运, 马尔科。

    http://markorodriguez.com

答案 1 :(得分:5)

在许多情况下,可以利用域的结构来提高性能。假设您知道,与A实体上x个关系的数量相比,您的y个实体的关系通常较少B。然后,您可以从A节点遍历两个步骤,查看B节点的显示位置,并以这种方式过滤掉C个节点。以下是此方法的一些代码:

Set<Node> found = new HashSet<Node>();
for ( Relationship firstRel : a1.getRelationships( Reltypes.x, Direction.OUTGOING ) )
{
    Node cNode = firstRel.getEndNode();
    for ( Relationship secondRel : cNode.getRelationships( Reltypes.y, Direction.INCOMING ) )
    {
        Node bNode = secondRel.getStartNode();
        if ( bNode.equals( b1 ) )
        {
            found.add( cNode );
            break;
        }
    }
}

另一种方法是启动两个扫描任何一方关系的线程。

第三种方法是创建一个专门的索引来帮助回答这种查询,这显然会损害插入性能。