给出一个包含两列的数据集,一列表示一个全部为文本(TF-IDF编码)的特征,另一列为标签列。如果有人可以阐明决策树的性质,削减决策的功能等,那将是很好的。
我试图从模型中可视化一棵树,我能够看到有Fi(i = 1,2,.... N)。对于单个功能,拥有N个这样的值意味着什么?
此代码表示模型的初始化。
data = data.toarray()
xg_train = xgb.DMatrix(data, label=label)
num_round = 10 # number of rounds for boosting
params = {'booster': 'gbtree', 'max_depth': 10, 'objective': 'multi:softmax', 'eval_metric': 'auc', 'silent': 1,
'num_class': class_count}
bst = xgb.train(params, xg_train, num_round)