使用scala运行DBSCAN源时,Spark会导致内存错误。我们怎么解决这个问题?

时间:2017-08-23 10:13:26

标签: scala apache-spark memory dbscan

我们使用了100,000个套件。 spark的版本是1.6.1,scala是2.1.0。 如何修复内存错误并获得良好结果?

enter image description here

1 个答案:

答案 0 :(得分:3)

Spark的各种DBSCAN插件都存在问题。

授予此报告:

  

Neukirchen,赫尔穆特。 “针对大数据和高性能计算范例的DBSCAN空间聚类实现的调查和性能评估。” (2016)。

对于像Scala这样的JVM语言,它应该很容易调用,例如ELKI并获得了相当不错的表现。