使用朴素贝叶斯预测模型

时间:2016-04-22 23:25:00

标签: scala apache-spark machine-learning naivebayes

大家好我不喜欢scala和sparl MLIB。

我有一个疾病疾病的数据集以及以下格式的症状:

疾病,症状1症状2症状3

我在CSV文件中有近300个上述格式的条目。

我想实现以下功能:

如果用户输入了症状,即症状1,症状2,症状3,模型必须能够预测疾病。

我有以下问题:

1)我应该使用哪种机器学习模型来实现这一功能。

2)如果错误纠正了我,我已经通过了一些模型和基础NAIVES贝叶斯模型。

3)我可以为Naives Bayes模型提供文本输入。

4)是否有可用于实现此功能的示例代码。

1 个答案:

答案 0 :(得分:0)

您可以使用Spark MLlib中的任何分类算法进一步参考阅读官方文档,并通过databricks博客https://databricks.com/blog/2015/07/29/new-features-in-machine-learning-pipelines-in-spark-1-4.html

通过此链接