我正在使用 Neo4j 存储图形数据,并且出于各种原因,我知道我想使用 Spark 作为执行引擎进行分析。
在寻找可以使我的生活更轻松的图形算法时-起初,我在阅读有关Spark GraphX 文档的信息。尽管我期待的是MLlib的图形版本,但唯一突出的算法是PageRank / Pregel。同时,所有三元组和邻居方法似乎都是相当基本的Cypher查询。然后,我遇到了 Cypher ,用于Apache Spark(CAPS)。
CAPS的PropertyGraph
似乎是Spark DataFrame的抽象,而GraphX的graph
是Spark RDD的抽象。这有很大的不同吗?
是否有任何主要差异化因素将GraphX和Cypher的分析功能区分开?