应用错误收集

spark-ml无标签数据评分

时间：2017-07-02 21:33:23

标签： scala apache-spark bigdata

EDITED：对于带标签的数据，我们可以使用LabeledPoint进行培训和测试。但是，如果我有一个未标记数据的数据框，那么找到它属于哪个类的概率的最佳方法是什么（假设二进制分类）？

假设数据框看起来像

DataPoint的数量|特征1 |特征2 | ... |功能1000 |

虽然特征的维度与训练中的LabeledPoints的维度相同。所有代码都在Scala中使用Spark 2.x。

0 个答案:

没有答案