我是XGBOOST包的新手,我想将它用于多类分类问题。
我现在有30个类(或标签),我已将它们转换为整数(0 - 29)。然后我从数据集上的XGBOOST包运行xgboost()方法。构建模型后,我使用predict()方法来预测新的测试数据。最后,我得到了一个数字向量作为最终输出。顺便说一句,所有数字都在0和1之间。
那么现在我该如何解释输出?这是概率吗?但我怎么知道应该与哪个班级相关?
由于
答案 0 :(得分:3)
我得到了它!输出是100,000 * 30值的矩阵。因此,每30个数字对应一个特定实例,这意味着每个数字是该实例作为标签的概率。
例如:
矩阵[1]是Prob(instance0 == label0)
matrix [32]是Prob(instance1 == label1)
矩阵[33] =习题(INSTANCE1 == LABEL3)