应用错误收集

Rive和Spark ML之间的朴素贝叶斯精度比较

时间：2017-02-27 07:37:28

标签： r machine-learning apache-spark-mllib naivebayes apache-spark-ml

我正在比较R和Spark ML之间的朴素贝叶斯分类器的准确性，并获得连续和分类数据集的以下结果

连续数据集 https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/breast-cancer-wisconsin.data

精度 R - 95％ Spark ML - 89％

分类数据集

https://archive.ics.uci.edu/ml/machine-learning-databases/car/car.data

精度 R - 84％ Spark ML - 75％

我想在生产中使用Spark Naive Bayes算法，请指导我最小化R和Spark ML的准确度之间的差异（我使用OnehotEncoder将分类转换为double）。

请帮助我理解为什么两个输出都有差异

0 个答案:

没有答案