仅使用一个特征构建学习模型是否有意义?

时间:2013-06-21 09:40:57

标签: machine-learning genetic-programming adaboost supervised-learning

为了提高adaboost分类器的准确性(用于图像分类),我使用遗传编程来推导出新的统计测量。每当生成新特征时,我通过训练adaboost分类器并测试其性能来评估其适应性。但我想知道这个程序是否正确;我的意思是使用单一功能来训练学习模型。

1 个答案:

答案 0 :(得分:1)

您可以在一个功能上构建模型。我假设,通过"一个功能"你的意思只是R中的一个数字(否则,它将完全"传统"用法)。然而,这意味着,您正在一维空间中构建分类器,因此 - 许多分类器将是多余的(因为它实际上是一个简单的问题)。更重要的是 - 检查您是否可以使用一个特定维度正确对对象进行分类并不意味着一旦您使用它们组合它是一个好/坏的功能。特别是可能是这样的情况:

  • 许多功能可能会发现"数据中的相同现象,所以 - 它们中的每一个都可以分别产生良好的结果,但一旦合并 - 它们就会比它们中的每一个更好(因为它们只是捕获相同的信息
  • 在组合使用之前,功能可能毫无用处。有些现象只能在多维空间中描述,如果你只分析一维数据 - 你就不会发现它们的真正价值,一个简单的例子就是考虑四点(0,0),(0,1),(1,0),(1,1)这样{ {1}}是一个类的元素,而另一个类的元素。如果你在每个维度上分别看 - 那么最好的准确度是(0,0),(1,1)(因为你总是在完全相同的点上有两个不同类的点 - 0和1)。合并后 - 您可以轻松地将它们分开,因为它是0.5问题。

总结一下 - 可以在一维空间中构建分类器,但是:

  • 这样的问题可以在没有重型机械的情况下解决。
  • 结果不应该用作功能选择的基础(或者更严格 - 这可能非常具有欺骗性)。