Spark ML(Dataframe)和降维

时间:2017-08-15 10:18:14

标签: apache-spark apache-spark-mllib apache-spark-ml dimensionality-reduction

如果使用较新的Dataframe API(即不是RDD),似乎没有可用于执行降维的类。也没有任何文件(https://spark.apache.org/docs/latest/ml-guide.html)。

有人能告诉我使用spark.ml(Dataframe)包中的类而不是spark.mllib(RDD)来降低维数的方法吗?有可能吗?

1 个答案:

答案 0 :(得分:4)

PCA可用于新的ML API。您可以在以下网址找到详细信息: