标签: python machine-learning classification cross-validation training-data
我想将数据分为训练数据和测试数据。
我的数据包括7个类别,每个样本可能具有不同的标签,因此它是一个多标签分类。
此外,我的数据不平衡,这意味着一个类别中的数据可能比另一个类别中的数据多三倍。
我想做StratifiedKFold,但它似乎不适合用于多标签分类。
StratifiedKFold
您能告诉我在这种情况下可以做什么吗?
我已经看过这个link和this
谢谢。