应用错误收集

spark ml验证预测概率

时间：2016-10-15 07:44:15

标签： apache-spark apache-spark-mllib naivebayes apache-spark-ml

我们使用具有良好预测准确度的Naive Bayes构建了一个文本分类解决方案。

在预测失败的情况下，我们正在显示预测概率，我们也会手动从训练数据中提取失败的测试用例的所有匹配文本，这些文本会显示给用户以支持预测逻辑。

这是一个非常好的功能，有助于决策支持。

目前手动完成从训练数据中提取匹配文本，这对于大型数据集无法进行扩展。

我假设使用Spark ML Lib，没有办法拉出匹配的文本以支持预测逻辑。有没有其他解决方案来提取匹配的句子？

0 个答案:

没有答案