我需要使用可扩展的解决方案来创建 Geohash连接图。
我发现Cypher for APache Spark是一个允许在spark数据帧上使用cypher来创建图形的项目,但是它只能通过 mapping 创建不可变图形不同的数据框,所以我没有得到所需的图形。
如果在 Neo4j浏览器上运行其他密码查询,我可以获得所需的图形,但是我存储的图形大约为 200 GB 。
所以我要问这种逻辑和使用Neo4j浏览器和 apoc 函数在 200 GB 的图形数据上快速运行查询吗?
答案 0 :(得分:0)
如果您要问Neo4j是否可以处理这种大小的数据库,那么答案是肯定的。但是,您将看到不同的结果,具体取决于数据的建模方式和要运行的查询的类型。
性能不一定与图的大小相关,而是与查询所接触和遍历的图部分有关。整个图的分析查询必须涉及整个图,而紧密定义的查询(涉及图的较小局部)将非常快。
您可以在查询中执行的任何操作来限制必须遍历或过滤的图的部分,这将有助于提高查询速度,因此,良好的建模以及对索引和约束的使用至关重要。