标签: python tensorflow machine-learning
我想通过过度采样和欠采样高度不平衡的数据集来训练ML模型。就我而言,过采样和欠采样数据集是两个不同的训练数据集,我将使用它们来训练ML模型。现在,当为最佳超参数调整模型时,应该使用过采样和欠采样的训练数据分别进行调整吗?还是应该使用不平衡数据集进行一次调整,并使用最佳超参数对类平衡数据集进行训练?
我知道训练集用于调整模型的超参数,但不知道是否需要分别针对欠采样和过采样的数据集进行调整。任何帮助将不胜感激。