Neo4J - 存储关系与节点

时间:2015-01-24 02:11:16

标签: neo4j graph-databases relationships

我想知道将数据存储到关系或节点中是否有任何优点或缺点。

例如,如果我要将与讨论相关的评论存储到数据库中,我是否应该将评论数据存储在"评论"关系或评论"通过单独的关系与讨论相关的节点。

1 个答案:

答案 0 :(得分:10)

正确的数据模型取决于您需要进行的查询类型。您应该弄清楚您的查询是什么,然后确定符合这些条件的数据模型:

  1. 它允许您回答所有问题,
  2. 它可以让您的查询足够快地完成,
  3. 它最大限度地减少了所需的数据库存储。
  4. 在讨论评论的情况下,您可能希望查询按时间顺序排列的讨论主题。因此,您不仅需要存储注释的时间,还需要存储注释之间的关系(因为讨论可以生成不共享相同优先注释的不相交线程)。

    让我们尝试一个简单的测试用例。假设有两个不相交的线程由同一个初始注释产生(我们称之为c1):[c1,c3]和[c1,c2,c4]。并且假设在这个简单的测试用例中,我们只对查询与主题相关的所有评论线程感兴趣。

    如果注释属性存储在节点中,则数据可能如下所示:

    (u1:User {name: "A"})-[:MADE]->(c1:Comment {time:0, text: "Fee"})-[:ABOUT]->(s1:Subject {title: "Jack"})
    (u2:User {name: "B"})-[:MADE]->(c2:Comment {time:1, text: "Fie"})-[:ABOUT]->(c1)
    (u3:User {name: "C"})-[:MADE]->(c3:Comment {time:3, text: "Foe"})-[:ABOUT]->(c1)
    (u4:User {name: "D"})-[:MADE]->(c4:Comment {time:9, text: "Fum"})-[:ABOUT]->(c2)
    

    如果你将注释属性存储在关系中,你可能会尝试类似下面的内容,但是有一个大的FLAW。关系无法直接指向另一种关系(正如我们在第2至4行中所做的那样)。由于此模型在neo4j中不合法,因此无法满足上述任何条件。

    (u1:User {name: "A"})-[c1:COMMENTED_ABOUT {time:0, text: "Fee"}]->(s1:Subject {title: "Jack"})
    (u2:User {name: "B"})-[c2:COMMENTED_ABOUT {time:1, text: "Fie"}]->(c1)
    (u3:User {name: "C"})-[c3:COMMENTED_ABOUT {time:3, text: "Foe"}]->(c1)
    (u4:User {name: "D"})-[c4:COMMENTED_ABOUT {time:9, text: "Fum"}]->(c2)
    

    因此,在我们的简单测试用例中,看起来将属性存储在节点中是唯一的选择。

    以下是获取不相交的线程路径的查询,包括发出每条注释的用户(WHERE子句过滤掉部分线程):

    MATCH p=(s:Subject)<-[:ABOUT*]-(c:Comment)<-[m:MADE]-(u:User)
    WHERE NOT (c)<-[:ABOUT]-()
    RETURN p