标签: apache-spark apache-spark-mllib naivebayes apache-spark-ml
我们使用具有良好预测准确度的Naive Bayes构建了一个文本分类解决方案。
在预测失败的情况下,我们正在显示预测概率,我们也会手动从训练数据中提取失败的测试用例的所有匹配文本,这些文本会显示给用户以支持预测逻辑。
这是一个非常好的功能,有助于决策支持。
目前手动完成从训练数据中提取匹配文本,这对于大型数据集无法进行扩展。
我假设使用Spark ML Lib,没有办法拉出匹配的文本以支持预测逻辑。有没有其他解决方案来提取匹配的句子?