标签: scala apache-spark memory dbscan
我们使用了100,000个套件。 spark的版本是1.6.1,scala是2.1.0。 如何修复内存错误并获得良好结果?
答案 0 :(得分:3)
Spark的各种DBSCAN插件都存在问题。
授予此报告:
Neukirchen,赫尔穆特。 “针对大数据和高性能计算范例的DBSCAN空间聚类实现的调查和性能评估。” (2016)。
对于像Scala这样的JVM语言,它应该很容易调用,例如ELKI并获得了相当不错的表现。