来自Spark Scala 2.2 apidocs:
def computeCost(dataset: Dataset[_]): Double
Computes the sum of squared distances between the input points and their corresponding cluster centers.
我想使用Haversine方法或类似的方法来computeCost()来测量地球表面(纬度,长度)上的距离。我可以覆盖Spark ML中的行为,还是必须退回到Spark MLib RDD实现中?