如何使用R中的xgboost包解释多类分类的输出?

时间:2015-11-17 04:06:26

标签: r multilabel-classification xgboost

我是XGBOOST包的新手,我想将它用于多类分类问题。

我现在有30个类(或标签),我已将它们转换为整数(0 - 29)。然后我从数据集上的XGBOOST包运行xgboost()方法。构建模型后,我使用predict()方法来预测新的测试数据。最后,我得到了一个数字向量作为最终输出。顺便说一句,所有数字都在0和1之间。

那么现在我该如何解释输出?这是概率吗?但我怎么知道应该与哪个班级相关?

由于

1 个答案:

答案 0 :(得分:3)

我得到了它!输出是100,000 * 30值的矩阵。因此,每30个数字对应一个特定实例,这意味着每个数字是该实例作为标签的概率。

例如:

矩阵[1]是Prob(instance0 == label0)

matrix [32]是Prob(instance1 == label1)

矩阵[33] =习题(INSTANCE1 == LABEL3)