我想知道一些算法列表,我可以根据输入设置进行实验来预测癌症或发烧或患者的任何可能性...请假设我有数百万的数据,所以我想尝试一下最好的算法来预测......我是数据挖掘和机器学习的新手......
答案 0 :(得分:3)
目前和最流行的预测和分类算法之一是Leo Breiman的Random Forests (RF)。它的实现也可以在weka中获得。
答案 1 :(得分:2)
问题有点模糊,我只能给出一个模糊的答案:使用全能的SVM!为SVM分类器提供数百万个输入向量,它应该能够为您提供最先进的预测。
如果您正在寻找SVM的实现,请查看libsvm,其中包含几乎所有体面编程语言的包装器。
答案 2 :(得分:2)
如果您正在专门研究估计某些事物的概率,那么您需要使用产生概率的机器学习方法。大多数只生成一个类标签:是/否。
最常见的估算概率的算法是Logistic回归。 Weka中提供了一种实现方式。
答案 3 :(得分:0)
开始使用大量机器学习库进行实验的最流行的工具是Weka。在这里,您可以上传数据并尝试许多算法。它的弱点是可扩展性,但它不适合用数据进行定位。