我们有一个简单的火车样本:
X y
0 "a"
1 "b"
和2个最简单的分类器,只有一个不同的最后一个参数 min_child_weight :
XGBClassifier(n_estimators=1, max_depth=1,
reg_lambda=0, learning_rate=1, min_child_weight=0.25)
和
XGBClassifier(n_estimators=1, max_depth=1,
reg_lambda=0, learning_rate=1, min_child_weight=0.250001)
如果我们拟合并尝试预测同一样本(predict_proba)上的概率,我们将得到:
array([[0.8807971 , 0.11920292],
[0.11920297, 0.880797 ]], dtype=float32)
和
array([[0.5, 0.5],
[0.5, 0.5]], dtype=float32
分别。这意味着,如果 min_child_weight> 0.25 ,我们将开始面临欠拟合的问题。 谁能告诉我这个 0.25 从何处出现?这是一个非常简单的示例,因此似乎可以轻松推论。