标签: python machine-learning
我得到了一个不平衡的数据集,并被要求执行以下功能:1 /随机化数据2 /填充训练和验证数据。 这意味着要随机整理数据,然后将其分为训练和验证集?
答案 0 :(得分:1)
是的,我要说的是问题要问你的。由于数据集不平衡,请确保分层(除非有理由不这样做,例如时间序列)。
答案 1 :(得分:1)
是的。这样做的主要目的是获得更多分层的培训和验证集。这是处理不平衡数据集的最简单方法。