培训文件数量对分类时间有何影响?

时间:2014-01-13 09:09:35

标签: performance machine-learning text-classification

培训文件数量对分类时间有影响吗?我知道K-nn K-nn中的所有计算都是在分类中进行的,而在训练中没有或最少的工作。 SVM,朴素贝叶斯,决策树等情况是否相同?

1 个答案:

答案 0 :(得分:2)

只有 lazy 分类器具有这样的特征,其中一个是KNN。

  • SVM - 分类时间取决于支持向量的数量,支持向量可能但不一定 - 取决于训练文档的数量(它们是SV数量的上限)
  • 朴素贝叶斯 - 没有影响,除非这些新文件带有许多新词,因为NB分类时间是O(特征数量),所以如果你不放大词汇表(如果是BOW模型)你是安全使用许多培训数据
  • 决策树 - 与NB相同,它仅取决于功能的数量(以及问题的复杂性,不随实例数量而变化)
  • 神经网络 - 这里的分类时间仅取决于神经元的数量