机器学习算法:哪个算法出问题?

时间:2013-05-22 08:28:16

标签: machine-learning artificial-intelligence

我是机器学习领域的新手,我注意到可以使用很多算法/算法集:SVM,决策树,朴素贝叶斯,感知器等...... 这就是为什么我想知道应该使用哪种算法来解决哪个问题?换句话说,哪种算法解决了哪个问题类?

所以我的问题是,如果你知道一个关注这个算法选择有问题的好网站或书吗?

任何帮助将不胜感激。 Thx提前。

6 个答案:

答案 0 :(得分:10)

选择Andrew Ng's machine learning course on coursera。它精美地组合在一起,解释了不同类型的ML算法之间的差异,提供了何时使用每种算法的建议,并且包含对于实践者以及数学有用的材料(如果您需要)。我自己正在学习机器学习,这是迄今为止最有用的资源。

(你可能会觉得有用的另一条建议是考虑学习python。这是基于我在早期阶段没有开始学习python并排除许多书籍,网页,sdks等的错误。事实证明,python非常容易上手,至少从我自己的个人观察来看,广泛用于机器学习和数据科学社区。)

答案 1 :(得分:4)

scikit-learn.org发布了这个信息图,即使您没有使用sklearn库,也会有所帮助。

enter image description here

答案 2 :(得分:2)

很难回答“问题哪个算法的问题?”

这种能力带来了大量的经验和知识。所以我建议,你应该阅读一些关于机器学习的好书。可能,下一本书将是一个很好的起点。

Machine Learning: A Probabilistic Perspective

一旦掌握了有关机器学习的知识,就可以解决几个简单的机器学习问题。 Iris flower dataset是一个很好的起点。它由属于三种虹膜物种的几种特征组成。最初开发一个简单的机器学习模型(如Logistic回归)来对Iris物种进行分类,逐渐地你可以转向更高级的模型,如Neural Networks

答案 3 :(得分:2)

@TooTone:在我看来,机器学习在行动可以帮助OP决定使用哪种技术来解决特定问题,因为本书给出了不同ML算法的明确分类以及优点,缺点和“与之合作” “对于他们每个人。我同意代码有点难以阅读,特别是对于那些不习惯矩阵操作的人。有多年的研究浓缩成10行Python程序,所以要做好准备,理解它需要一天(对我来说至少)。

答案 4 :(得分:0)

作为一个简单的起点,我会考虑我的输入和我想要的输出,这通常会缩小任何情况下的选择。例如,如果我有每个输入的类别,而不是数字和目标类别,则决策树是个好主意。如果我没有目标,我只能进行聚类。如果我有数字输入和数字输出,我可以使用神经网络或其他类型的回归。我还可以使用生成回归方程的决策树。在此之后还有其他问题需要提出,但这是一个很好的起点。

答案 5 :(得分:0)

以下DZone Refcard也可能有用.. http://refcardz.dzone.com/refcardz/machine-learning-predictive。但是你最终必须深入研究每个细节。