使用数据集API创建密集向量

时间:2017-10-10 17:56:59

标签: java apache-spark vector machine-learning

我的数据集有多列,我想用选择列创建特征向量。我尝试使用org.apache.spark.ml.feature.VectorAssembler包的VectorAssembler,但由于我的数据集有多个空值,因此VectorAssembler的转换方法失败。 VectorAssembler有什么替代品吗? 创建密集向量的任何其他方法可以传递给机器学习分类模型吗?

0 个答案:

没有答案