应用错误收集

使用朴素贝叶斯预测模型

时间：2016-04-22 23:25:00

标签： scala apache-spark machine-learning naivebayes

大家好我不喜欢scala和sparl MLIB。

我有一个疾病疾病的数据集以及以下格式的症状：

疾病，症状1症状2症状3

我在CSV文件中有近300个上述格式的条目。

我想实现以下功能：

如果用户输入了症状，即症状1，症状2，症状3，模型必须能够预测疾病。

我有以下问题：

1）我应该使用哪种机器学习模型来实现这一功能。

2）如果错误纠正了我，我已经通过了一些模型和基础NAIVES贝叶斯模型。

3）我可以为Naives Bayes模型提供文本输入。

4）是否有可用于实现此功能的示例代码。

1 个答案:

答案 0 :(得分：0)

您可以使用Spark MLlib中的任何分类算法进一步参考阅读官方文档，并通过databricks博客https://databricks.com/blog/2015/07/29/new-features-in-machine-learning-pipelines-in-spark-1-4.html

通过此链接