我有一个很大的neo4j数据库。我需要检查图中是否存在多个模式,我认为这些模式可以在hadoop中轻松完成。但是,我不确定将neo4j中的元组提供给hadoop的最佳方法。有什么建议吗?
答案 0 :(得分:3)
在我看来,虽然可以做到,但我不认为MapReduce(我相信你说“Hadoop”时的意思)是图形分析的一个好的(或者至少是高性能的)选择。您需要Bulk Synchronous Parallel方法。如果您想执行云规模图分析,您需要Apache Giraph,它“了解”Hadoop生态系统。
然后,我会问你为什么需要在Neo4J之外使用任何东西。我显然不了解你的用例,但首先要确保你不能在Neo4J中做你需要做的事。