algorithm - 机器学习中的一些混淆

机器学习中的一些混淆

时间：2016-08-12 03:06:33

标签： algorithm machine-learning scikit-learn

当我使用机器学习算法时，我有两个困惑。起初，我不得不说我只是使用它。

有两个类别A和B，如果我想从他们的混合物中选择多少A，我应该使用什么样的算法（不需要考虑样本数量）。起初我认为它应该是一种分类算法。我在TMVA包中使用了例如boost决策树，但有人告诉我BDT确实是一种回归算法。
我找到粗略数据时。如果我在把它扔给BDT之前对它进行分析（做一些组合......），结果比将粗数据抛入BDT要好。由于粗略数据包含所有信息，为什么我需要自己进行分析呢？

你不清楚，请添加评论。希望你能给我任何建议。

2 个答案:

答案 0 :(得分：1)

对于2，您必须对数据执行一些操作并将其提供以更好地执行，因为它没有内置到analyze的算法中。它只查看数据和classifies。你提出的分析问题被称为feature selection或feature engineering，它必须手工完成（当然，除非你使用某种技术来学习特征，例如深度学习）。在机器学习中，很多时候，操纵/工程特征比原始特征表现更好。

对于1，我认为BDT可以用于回归和分类。这看起来像一个分类问题（选择或不选择）。因此，您应该使用分类算法

答案 1 :(得分：-1)

你确定ML是解决问题的方法吗？如果是，一些分类算法将是：逻辑回归，神经网络，支持向量机，desicion树等等。