使用R的层次预测

时间:2014-05-17 20:30:17

标签: r machine-learning classification document-classification text-classification

我在R中很新,我找不到任何有关可以执行以下操作的程序包的信息:假设我有一组数据(例如,不同的文本文档),可以有多个类。

例如,一个基准可以是运动,带球的运动,没有球的运动和汽车。我希望能够预测数据属于哪个类别,考虑到我可能不会认为数据是带球的运动,但如果我正确地预测它是一个运动,我会很高兴。

哪个包可以提供这种东西?如果可能的话,一些例子会很有用。

提前致谢

1 个答案:

答案 0 :(得分:0)

我不知道R中可以进行分层分类的任何特定包。所以有两种选择:

  • 使用C API SVMstruct http://www.cs.cornell.edu/people/tj/svm_light/svm_struct.html。从头开始在R中进行编程将是相当有用的工作。
  • 构建您自己的分层分类器系统。在自上而下的情况下,每个级别都有一个多类分类器,例如: rec vs sci和motorcycles vs sport等。您将使用顶级分类器并使用其预测来选择下一个分类器。您输入的用于训练具有节点的分类器的数据是以该节点为根的子树中的所有数据的并集。

详情请参阅http://jmlr.org/papers/v6/tsochantaridis05a.html