大家好我不喜欢scala和sparl MLIB。
我有一个疾病疾病的数据集以及以下格式的症状:
疾病,症状1症状2症状3
我在CSV文件中有近300个上述格式的条目。
我想实现以下功能:
如果用户输入了症状,即症状1,症状2,症状3,模型必须能够预测疾病。
我有以下问题:
1)我应该使用哪种机器学习模型来实现这一功能。
2)如果错误纠正了我,我已经通过了一些模型和基础NAIVES贝叶斯模型。
3)我可以为Naives Bayes模型提供文本输入。
4)是否有可用于实现此功能的示例代码。
答案 0 :(得分:0)
您可以使用Spark MLlib中的任何分类算法进一步参考阅读官方文档,并通过databricks博客https://databricks.com/blog/2015/07/29/new-features-in-machine-learning-pipelines-in-spark-1-4.html
通过此链接