spark ml验证预测概率

时间:2016-10-15 07:44:15

标签: apache-spark apache-spark-mllib naivebayes apache-spark-ml

我们使用具有良好预测准确度的Naive Bayes构建了一个文本分类解决方案。

在预测失败的情况下,我们正在显示预测概率,我们也会手动从训练数据中提取失败的测试用例的所有匹配文本,这些文本会显示给用户以支持预测逻辑。

这是一个非常好的功能,有助于决策支持。

目前手动完成从训练数据中提取匹配文本,这对于大型数据集无法进行扩展。

我假设使用Spark ML Lib,没有办法拉出匹配的文本以支持预测逻辑。有没有其他解决方案来提取匹配的句子?

0 个答案:

没有答案