在Spark上实现k-均值聚类时指定距离度量的方法是什么

时间:2018-12-07 23:58:37

标签: apache-spark pyspark k-means apache-spark-mllib

我想在具有欧氏距离和曼哈顿距离的Spark上实现k-均值聚类。虽然函数默认使用欧几里得距离,但我想知道在实现k均值时是否有任何方法可以指定其他距离度量。

编辑:我已经提到了您所指出的答案。但是我验证了文档,但找不到distancemeasure参数。另外,我想测量曼哈顿距离,因为只有“欧几里得”和“余弦”是可用的选项。

0 个答案:

没有答案