当我使用机器学习算法时,我有两个困惑。起初,我不得不说我只是使用它。
有两个类别A和B,如果我想从他们的混合物中选择多少A,我应该使用什么样的算法(不需要考虑样本数量)。起初我认为它应该是一种分类算法。我在TMVA包中使用了例如boost决策树,但有人告诉我BDT确实是一种回归算法。
我找到粗略数据时。如果我在把它扔给BDT之前对它进行分析(做一些组合......),结果比将粗数据抛入BDT要好。由于粗略数据包含所有信息,为什么我需要自己进行分析呢?
你不清楚,请添加评论。希望你能给我任何建议。
答案 0 :(得分:1)
对于2,您必须对数据执行一些操作并将其提供以更好地执行,因为它没有内置到analyze
的算法中。它只查看数据和classifies
。你提出的分析问题被称为feature selection
或feature engineering
,它必须手工完成(当然,除非你使用某种技术来学习特征,例如深度学习)。在机器学习中,很多时候,操纵/工程特征比原始特征表现更好。
对于1,我认为BDT可以用于回归和分类。这看起来像一个分类问题(选择或不选择)。因此,您应该使用分类算法
答案 1 :(得分:-1)
你确定ML是解决问题的方法吗?如果是,一些分类算法将是: 逻辑回归,神经网络,支持向量机,desicion树等等。