标签: apache-spark apache-spark-mllib apache-spark-ml dimensionality-reduction
如果使用较新的Dataframe API(即不是RDD),似乎没有可用于执行降维的类。也没有任何文件(https://spark.apache.org/docs/latest/ml-guide.html)。
有人能告诉我使用spark.ml(Dataframe)包中的类而不是spark.mllib(RDD)来降低维数的方法吗?有可能吗?
答案 0 :(得分:4)
PCA可用于新的ML API。您可以在以下网址找到详细信息:
PCA