Apache Spark Mlib

时间:2015-12-03 09:16:52

标签: java apache-spark k-means apache-spark-mllib

我正在尝试使用Spark中的MLlib在Java上实现KMeans并且我偶然发现了一个问题,即尽管我已经导入了正确的jar,但我的编译器无法识别此行< / p>

// Cluster the data into two classes using KMeans
    int numClusters = 2;
    int numIterations = 20;
    KMeansModel clusters = KMeans.train(parsedData.rdd(), numClusters, numIterations);

我得到的错误是:The method train(<RDD> vector, int, int) is undefined for the type KMeans() 从那以后没有任何意义,我已经下载了最新的apache MLlib(1.5.2)jar,并且它也是在Javadoc中定义的。

有什么想法吗?有没有人遇到过这种问题?

1 个答案:

答案 0 :(得分:0)

我遇到了类似的问题,通过导入正确的库解决了,

import org.apache.spark.mllib.clustering.KMeans;
import org.apache.spark.mllib.clustering.KMeansModel;

代替

import org.apache.spark.ml.clustering.KMeans;
import org.apache.spark.ml.clustering.KMeansModel;