用新数据重新训练分类器会产生大量的类变化

时间:2021-01-02 20:01:32

标签: machine-learning classification xgboost training-data

我每天都在 15 万条记录上训练 XGBoost 二进制分类器。 每天,大约有 500 条记录添加到训练集。 测试集(推理)10M 记录,无标签。 我注意到连续几天训练的两个模型对相同的记录(高达 10% 的推理数据)产生了根本不同的预测。 我现在尝试过的:

  1. 设置相同的种子和参数。
  2. 不同的分类器。

我担心的是,该模型的泛化程度不够,因此每日预测会发生重大变化。 我很想知道解决这个问题的可能方法

0 个答案:

没有答案
相关问题