java - MLlib算法的输入向量中的NaN - Thinbug

MLlib算法的输入向量中的NaN

时间：2016-04-20 13:12:00

标签： java scala apache-spark apache-spark-mllib

我想使用spark的MLlib函数对数据进行聚类。问题是，在我的数据集中，有时我会将NULL作为特征值。

我不能写0.0代替它，因为它错了。所以我尝试使用Double.NaN作为值。这不起作用，集群失败了：

java.lang.IllegalArgumentException: requirement failed

处理此问题的常用方法是什么？

0 个答案:

没有答案