用例:使用Neo4j在大型公共文档集与小型私有公司文档之间进行文本分析
大量文档在不断变化(例如,每周20万个文档加上100个新文档)。理想情况下,大型集群将处理大型公共数据集并更新公共图。
用户可以提交文件目录(例如100个文档,每周更改10个)。用户文档是专有的,因此文件需要彼此隔离。使用与公开文档相同的算法对文档进行制图。
鉴于所有这些,我想为大型集合提供一个通用的图形数据库,并且每个用户为其文档提供一个单独的图形数据库。为了分析公共和用户之间的关系,公共和私有图节点之间将需要存在关系。可以更新公共图/数据库,而不会影响与私有图的关系。
一种方法可能是从公用图的副本开始并添加用户图,但是公共图将具有许多副本,这使维护工作变得很头疼。除了蛮力外,Neo4j(或其他图形数据库)是否有任何功能可以直接支持此用例?