标签: machine-learning
我想用数据集构建两类分类模型,其中一些变量可能在训练数据和测试数据之间存在协变量偏移问题。一些解释数据集移位解决方案的网站介绍了使用Kullback-Leibler散度(KLD)来测量训练和测试数据之间每个特征中两个分布的距离的方法。但是他们都没有提供有关确定协变量偏移的KLD阈值的信息。有什么方法可以确定阈值或任何常用值作为阈值?