R中的随机森林 - 许多班级

时间:2012-11-07 01:28:22

标签: r classification random-forest

我想用R randomForest做一个多标签分类。 我有十个班A..J,

我找到了如何预测单个类的示例,例如:

r = randomForest(J ~., data=train, importance=TRUE, do.trace=100)

但我想预测更多的课程,例如H,I,J。 (即说只有A..G被赋予属性)。 我该怎么办?

我有一个想法是保留A..G而只预测一个类(H / I / J)并运行randomForest 3次,但也许有更好的方法?要一次性完成吗?

非常感谢提前。

1 个答案:

答案 0 :(得分:1)

假设所有属性H,I和J都是二进制的。然后,您可以预测具有2 ^ 3个可能值的新属性K,然后将结果解码回3个属性:

  • 1 - > 0,0,0
  • 2 - > 0,0,1
  • 3 - > 0,1,0
  • 4 - > 0,1,1
  • 5 - > 1,0,0
  • 6 - > 1,0,1
  • 7 - > 1,1,0
  • 8 - > 1,1,1-