我刚开始进入机器学习领域。到目前为止,我知道贝叶斯方法是该领域的主要方法之一。那么还有其他选择吗?以及它们之间的任何比较,例如哪种方法应该在哪里使用。
答案 0 :(得分:4)
Decisions trees 是用于构建用于分类的树的通用机器学习方法。树的每个中间节点具有与其相关联的条件,该条件用于选择右子树或左子树以供将来分类。树的叶子代表问题的类别。看看ID3或C4.5等算法(改进ID3)。决策树很快,可用于创建非线性decision boundaries。
Artificial neural network 是一个包含多层神经元的分类器。每个神经元都具有多个输入和单个输出的功能。神经元的输入是其他神经元的输出或分类器的输入(特征)。神经网络中的信号通常从输入到输出的一个方向,但也已经研究了递归神经网络。神经网络训练最重要的算法是back propagation algorithm - 一种用于训练多层神经网络的着名算法。
元分类器或 ensemble classifiers 是组合不同分类器以执行单个分类的方法。最简单的方法是投票,但有更多高级方法,例如:堆叠,评分,boosting,AdaBoost,Random Forest,旋转森林等。
Logistic regression 是另一种流行的机器学习算法。它只能创建线性决策边界,但应该比其他更复杂的算法更快地工作,并且可以成为第一个算法在面对新问题时尝试的好选择。
SVM 是机器学习领域最常用的算法之一。它似乎被用于从文本分类到图像分类的大多数分类问题。该算法基于数据集的非线性变换,因此可以创建线性决策边界进行分类。
Regression analysis 与分类算法不同,它用于根据要素值预测连续值(例如房价)。如果您想研究机器学习的这一分支,您应该从Linear Regression algorithm开始。
与监督学习相比,每个示例都有一个目标值, unsupervised learning 方法用于分析未标记的数据,例如一组文章。无监督学习不是用于预测或分类,而是用于检测相关项目组。如果您要学习这个主题,您应该从k-means clustering开始。
Reinforcement learning 是在代理达到某些结果时将数据呈现给学习代理的方法。例如,学习如何下国际象棋的代理人如果赢得比赛就会“奖励”,如果他输了就“受到惩罚”但是没有收到关于其中间步骤结果的有用信息。当没有关于每种特定情况下的最佳行动的信息可用时,强化学习的算法用于推断最佳行动策略。