机器学习中的一些混淆

时间:2016-08-12 03:06:33

标签: algorithm machine-learning scikit-learn

当我使用机器学习算法时,我有两个困惑。起初,我不得不说我只是使用它。

  1. 有两个类别A和B,如果我想从他们的混合物中选择多少A,我应该使用什么样的算法(不需要考虑样本数量)。起初我认为它应该是一种分类算法。我在TMVA包中使用了例如boost决策树,但有人告诉我BDT确实是一种回归算法。

  2. 我找到粗略数据时。如果我在把它扔给BDT之前对它进行分析(做一些组合......),结果比将粗数据抛入BDT要好。由于粗略数据包含所有信息,为什么我需要自己进行分析呢?

  3. 你不清楚,请添加评论。希望你能给我任何建议。

2 个答案:

答案 0 :(得分:1)

对于2,您必须对数据执行一些操作并将其提供以更好地执行,因为它没有内置到analyze的算法中。它只查看数据和classifies。你提出的分析问题被称为feature selectionfeature engineering,它必须手工完成(当然,除非你使用某种技术来学习特征,例如深度学习)。在机器学习中,很多时候,操纵/工程特征比原始特征表现更好。

对于1,我认为BDT可以用于回归和分类。这看起来像一个分类问题(选择或不选择)。因此,您应该使用分类算法

答案 1 :(得分:-1)

你确定ML是解决问题的方法吗?如果是,一些分类算法将是: 逻辑回归,神经网络,支持向量机,desicion树等等。