Question

我正在处理一个相对较小的数据集，我使用Python脚本收集了该数据集，然后将其写入Neo4j数据库以进行快速访问。大约有20000个节点，这些节点之间大约有500万个关系。收集Python中的数据并在几分钟之内放入字典中，然后我遍历整个字典一次以插入所有节点，再一次插入所有关系。这两个动作都包含一个交易。

正如我提到的，收集数据需要几分钟，编写节点也需要几分钟。但是，创建这些关系要花很多时间（我上次检查15个小时）。我想知道如何提高这些查询的性能，也许有一些明显的问题我正在忽略，或者也许有些我不熟悉的“交易技巧”。

有问题的密码查询如下：

CREATE(node: Model { name: 'example', path: 'example'})

MATCH (parent:Model {name: '', path: ''}),
    (child1:Model {name: '', path: ''}),
    (child2:Model {name: '', path: ''}),
    (child3:Model {name: '', path: ''})
MERGE (child1)-[r1:DEPENDS_ON]->(parent),
MERGE (child2)-[r2:DEPENDS_ON]->(parent),
MERGE (child3)-[r3:DEPENDS_ON]->(parent)

编辑1 因此，仅是进行更新，问题仍然存在，我觉得我应该提供一些其他信息。

名称和路径上有一个复合索引，这两个字段在一起是唯一的
据我所知，在我的查询中，每个字段仅被发现一次（因此没有基数问题）

编辑2 我已经执行并测试了一个查询，它由大约70个孩子与一个单亲建立关系（大约71个匹配查询）。通过Python脚本执行此查询所产生的总运行时间为 12秒，而在neo4j桌面上，该运行时间仅需 3毫秒。

如果有人有任何改进建议，将非常欢迎。我唯一能想到的就是创建某种唯一密钥，在其上添加索引，并仅通过一个字段来查找模型。但是话又说回来，这真的会带来多大的改变？谢谢大家。

如何提高Neo4j关系创建查询的性能

0 个答案: