我正在处理一个相对较小的数据集,我使用Python脚本收集了该数据集,然后将其写入Neo4j数据库以进行快速访问。大约有20000个节点,这些节点之间大约有500万个关系。收集Python中的数据并在几分钟之内放入字典中,然后我遍历整个字典一次以插入所有节点,再一次插入所有关系。这两个动作都包含一个交易。
正如我提到的,收集数据需要几分钟,编写节点也需要几分钟。但是,创建这些关系要花很多时间(我上次检查15个小时)。我想知道如何提高这些查询的性能,也许有一些明显的问题我正在忽略,或者也许有些我不熟悉的“交易技巧”。
有问题的密码查询如下:
CREATE(node: Model { name: 'example', path: 'example'})
MATCH (parent:Model {name: '', path: ''}),
(child1:Model {name: '', path: ''}),
(child2:Model {name: '', path: ''}),
(child3:Model {name: '', path: ''})
MERGE (child1)-[r1:DEPENDS_ON]->(parent),
MERGE (child2)-[r2:DEPENDS_ON]->(parent),
MERGE (child3)-[r3:DEPENDS_ON]->(parent)
编辑1 因此,仅是进行更新,问题仍然存在,我觉得我应该提供一些其他信息。
编辑2 我已经执行并测试了一个查询,它由大约70个孩子与一个单亲建立关系(大约71个匹配查询)。通过Python脚本执行此查询所产生的总运行时间为 12秒,而在neo4j桌面上,该运行时间仅需 3毫秒。
如果有人有任何改进建议,将非常欢迎。我唯一能想到的就是创建某种唯一密钥,在其上添加索引,并仅通过一个字段来查找模型。但是话又说回来,这真的会带来多大的改变?谢谢大家。