针对不同数据集参数的机器学习分类器

时间:2018-04-12 08:50:26

标签: machine-learning

为什么不同分类器的行为因不同数据而异? 基于什么参数,我们可以决定特定数据集的良好分类器?

2 个答案:

答案 0 :(得分:0)

  

对于某些数据集,朴素贝叶斯比SVM分类器提供更好的准确性   对于其他数据集,SVM比朴素贝叶斯表现更好。为什么   所以?是什么原因?

那些是完全不同的分类器。如果你有一个分类器总是优于另一个分类器。那你为什么需要“坏人”?

首先谷歌关于什么时候SVM不是最好的选择:

enter image description here

答案 1 :(得分:0)

这个问题没有一般答案。要了解在需要了解分类过程背后的算法时要使用的分类器。

例如,逻辑回归假设y的正态分布,并且当特定参数不是唯一决定因素时通常是有用的,但是因素的组合权重产生差异,例如在文本分类中。

另一方面,决策树根据提供大部分信息的参数进行分割。因此,如果您有一组与标签高度相关的参数,那么使用基于决策树的分类器更有意义。

SVM,基于识别足够的超平面而工作。当无法在一个平面中对数据进行分类但将其投影到更高的平面时,这些通常很有用。这是关于SVM https://blog.statsbot.co/support-vector-machines-tutorial-c1618e635e93

的一个很好的教程

简而言之,了解哪种分类器在哪种情况下更好的唯一方法是了解它们的工作方式,然后确定它们是否最适合您的情况。

另一种粗暴的方式是尝试每个分类器并选择最好的分类器,但我不认为你对此感兴趣。